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(57) Abstract: The invention concerns the genome sequence and nucleotide sequences coding for Streptococcus agalactiae polypep- 
Q£ tides, such as cellular envelope polypeptides, or secreted or specific polypeptides, or polypeptides involved in the metabolism and the 
^1 replication process, as well as vectors or cells comprising said sequences. The invention also concerns the use thereof for developing 

vaccines, diagnostic tools, DNA chips and for identifying therapeutic targets. 

(57) Abrege : L' invention a pour objet la sequence genomique et des sequences nucleotidiques codant pour des polypeptides de 
Streptococcus agalactiae, tels que des polypeptides d'enveloppe cellulaire, ou des polypeptides secretes ou specifiques, ou impliques 
dans le metabolisme et dans le processus de replication, ainsi que des vecteurs ou cellules incluant lesdites sequences. L' invention 

£^ porte egalement sur leur application au developpement de vaccins, d'outils de diagnostic, de puces a ADN et a 1' identification de 

)^ cibles therapeutiques. 
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Sequence du genome Streptococcus agalactiae, application au developpement de 
vaccins, d'outils de diagnostic, et a 1' identification de cibles therapeutiques. 

L'invention a pour objet la sequence genomique et des sequences nucleotidiques 
5 codant pour des polypeptides de Streptococcus agalactiae, tels que des polypeptides 
d'enveloppe cellulaire, ou des polypeptides secretes ou specifiques, ou impliques dans 
le metabolisme et dans le processus de replication, ainsi que des vecteurs ou cellules 
incluant lesdites sequences. L'invention porte egalement sur leur application au 
developpement de vaccins, d'outils de diagnostic, de puces a ADN et a Identification 
10 de cibles therapeutiques. 

Streptococcus agalactiae est un streptocoque P-hemolytique qui constitue la 
seule espece appartenant au groupe B de Lancefield (SGB). Les infections neonatales a 
streptocoques du groupe B posent un important probleme de sante publique qui ne se 

15 limite pas aux pays en voie de developpement. Leur incidence est de 2,5 pour 1 000 
naissances, avec un taux de mortalite qui varie actuellement dans les pays industrialises 
entre 4 et 10 % selon les etudes. Cette bacterie est responsable d'environ 20 % des 
meningites bacteriennes recensees en France et des sequelles neurologiques sont alors 
observees dans 25 a 50 % des cas. Elle est egalement a 1'origine de mort foetale in utero. 

20 Le polyoside capsulaire est Tantigene de surface majeur des SGB. Cinq serotypes (la, 
lb, II, III et V) sont generalement detectes au cours des infections humaines, le serotype 
III etant retrouve dans 75 % des infections neonatales avec atteinte meningee. Au 
niveau cellulaire et moleculaire, les differentes etapes du processus infectieux du a S. 
agalactiae sont encore peu connues. II est vraisemblable que, dans le cas du syndrome 

25 precoce (infections survenant dans les 24 premieres heures), la bacterie inhalee penetre 
dans les cellules de Tepithelium alveolaire du nouveau-ne et traverse cette barriere pour 
disseminer ulterieurement dans la circulation generale. La genese du syndrome tardif 
precoce (infections survenant entre le 7eme jour et le 3eme mois) et des autres 
infections a SGB reste encore tres mal comprise. Le seul facteur de virulence des SGB 

30 dont le role a ete clairement demontre est le polyoside capsulaire qui permet 
Techappement au systeme immunitaire de l'hote. La contribution exacte de certaines 
proteines de surface (antigene C, proteine Rib et C5a peptidase) a la virulence de cette 
bacterie est encore peu connue. 
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Une recherche realisee sur le site EXPASY (http://www.expasy.ch/) indique 
qu'il existe 112 references de sequences proteiques dans les banques Swissprot et 
TREMBL. Ce nombre inclut des proteines codees par des plasmides de S. agalactiae. 
Ces sequences representent done une vision partielle d'un nombre limite d'aspect de la 
5 biologie de S. agalactiae. La biosynthese de la capsule polysaccharidique est un des 
aspects les mieux connus de la virulence de cette bacterie. Par ailleurs, les genes codant 
pour 6 proteines exposees a la surface sont egalement connus (3). 

Afin d'apprehender de maniere globale les determinants genetiques impliques 

1 0 dans ces processus ainsi que le metabolisme de Streptococcus agalactiae, le sequen9age 
du genome de Streptococcus agalactiae a ete realise. Le genome de la souche 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) qui a ete responsable d'une 
septicemic mortelle a ete choisi pour ce sequen9age. Cette souche possede un serotype 
capsulaire III, ne presente pas de resistance acquise aux antibiotiques, est genetiquement 

1 5 modifiable et est virulente dans un modele d'infection murin. La connaissance complete 
du genome est une etape cruciale pour la caracterisation des genes impliques dans le 
developpement du processus infectieux : adhesion et franchissement des structures 
epitheliales, echappement au systeme immunitaire et adaptation a des conditions de 
culture variees et souvent hostiles (pH, stress oxydatif et carences nutritionnelles), qui 

20 constituent des cibles potentielles pour de nouvelles strategies therapeutiques. La 
comparaison du genome de S. agalactiae avec ceux d'autres pathogenes a Gram positif 
{Streptococcus pyogenes, Streptococcus pneumoniae, Streptococcus mutans, 
Staphylococcus aureus, Listeria monocytogenes, ...) doit permettre d f identifier de 
nouveaux genes de virulence ainsi crue nouvelles cibles pour construire des souches de 

25 virulence attenuees et des vaccins. Les proteines de surfaces constituent des candidats 
pour une future preparation vaccinale. Dans les tableaux 2 et 6 ci-apres sont repertories 
respectivement 25 et 30 nouveaux genes, nouvellement identifies, codant pour des 
proteines potentiellement liees au peptidoglycane et presentant le motif de liaison 
LPXTG. 

30 

La sequence complete du genome de Streptococcus agalactiae (CIP 82.45 
(ATCC 12403)) a ete obtenue. Ce genome est constitue d'un chromosome long 
d'environ 2,2 Mb identifie ici sous forme de 138 contigs representes par les sequences 
SEQ ID No. 1 a SEQ ID No. 136, SEQ ID No. 138 et SEQ ID No. 139, et d'un plasmide 
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long de 45 kbases present dans la souche sequencee represents par la sequence SEQ ID 
No. 137. La sequence complete du genome est representee par la sequence SEQ ID No. 
2345. 

Une liste des phases codantes annotees identifiees par l'analyse des sequences de 
5 ces contigs est donnee au tableau 1 . 

Une liste des phases codantes pour des proteines de surface nouvellement 
identifiees est donnee au tableau 2 comme indique precedemment. 

Une liste des phases codantes annotees identifiees par l'analyse de la sequence 
genomique complete SEQ ID No. 2345 est donnee au tableau 3. 
1 0 Une liste des phases codantes pour des proteines de surface identifiees a partir 

de l'analyse de la sequence genomique complete SEQ ID No. 2345 est donnee au 
tableau 6 (proteines liees au peptidoglycane), tableau 8 (lipoproteines).Tableau 9 (autres 
proteines de suface), Tableau 10( proteines impliquees dans la biosynthese des 
composes polysaccharidiques) 

15 

La presente invention concerne les sequences nucleotidiques et polypeptidiques 
de Streptococcus agalactiae CIP 82.45 (ATCC 12403). 

Ainsi, c'est un objet de la presente invention que de caracteriser la sequence du 
genome de Streptococcus agalactiae, CIP 82.45 (ATCC 12403) contenu dans la banque 
20 genomique preparee a partir du genome de cette souche et deposee a la CNCM le 28 
decembre 2000 sous le numero 1-2610, ainsi que de tous les genes et sequences 
regulatrices non codantes contenus dans ledit genome. 

La presente invention concerne done une sequence nucleotidique isolee et/ou 
purifiee de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi les 
25 sequences SEQ ID No. 1 a SEQ ID No. 139 et la sequence SEQ ID No. 2345. 

La presente invention concerne egalement une sequence nucleotidique isolee 
et/ou purifiee, issue de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie 
parmi : 

a) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
30 98 % d'identite avec une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et 

SEQ ID No. 2345 ; 

b) une sequence nucleotidique hybridant dans des conditions de forte stringence avec 
une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, 
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et comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 
150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

c) une sequence nucleotidique complementaire d'une sequence choisie parmi SEQ ID 
No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou complementaire d'une sequence 

5 nucleotidique telle que definie en a), ou b), ou une sequence nucleotidique de TARN 

correspondant a Tune des sequences a) ou b) ; 

d) une sequence nucleotidique d'un fragment representatif d'une sequence choisie 
parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou d'un fragment 
representatif d'une sequence nucleotidique telle que definie en a), b) ou c) et 

10 comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 150, 

200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

e) une sequence nucleotidique comprenant une sequence telle que definie en a), b), c) 
ou d) ; et 

f) une sequence nucleotidique telle que definie en a), b), c), d) ou e) modifiee, de 
15 preference comportant au plus 10 %, 5 %, 1 % ou 0, 5 % de nucleotides modifies par 

rapport a la sequence de reference. 

De fa<?on plus particuliere, la presente invention a egalement pour objet les 
sequences nucleotidiques isolees et/ou purifiees, caracterisees en ce qu'elles sont issues 
de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et en ce qu'elles codent pour 
20 un polypeptide choisi parmi les polypeptides de sequence SEQ ID No. 140 a SEQ ID 
No. 2344, et SEQ ID No. 2346 a SEQ ID No. 4481. 

La presente invention concerne aussi de fa?on plus generale les sequences 
nucleotidiques issues de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et 
codant pour un polypeptide de Streptococcus agalactia, telles qu'elles peuvent etre 
25 isolees a partir de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345. 

De plus, les sequences nucleotidiques isolees et/ caracterisees en ce qu'elles 
comprennent une sequence nucleotidique choisie parmi : 

a) une sequence nucleotidique codant pour un polypeptide choisi parmi les sequences 
SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 ; 
30 b) une sequence nucleotidique comportant au moins 75 %,. 80 %, 85 %, 90 %, 95 % ou 
98 % d'identite avec une sequence nucleotidique codant pour un polypeptide choisi 
parmi les sequences SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ 
ID No. 4481 ; 
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c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique codant pour un polypeptide, choisi parmi les sequences 
SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481, et 
comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 150, 

5 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
definie en a), b), c) ou d) et comprenant au moins 20 nucleotides, de preference 25, 

10 30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 

nucleotides ; et 

f) une sequence telle que definie en a), b), c), d) ou e) modifiee, de preference 
comportant au plus 10 %, 5 %, 1 % ou 0,5 % de nucleotides modifies par rapport a la 
sequence de reference, 

1 5 sont egalement des objets de 1' invention. 

Selon une realisation avantageuse, l'invention a pour objet les sequences 
nucleotidiques isolees et/ caracterisees en ce qu'elles comprennent une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique SEQ ID No. 4482 a SEQ ID No. 6617 ; 
20 b) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
98 % d'identite avec une sequence nucleotidique choisi parmi les sequences SEQ ID 
No. 2346 a SEQ ID No. 4481 ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique choisi parmi les sequences SEQ ID No. 4482 a SEQ ID 

25 No. 6617, et comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 

75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
30 definie en a), b), c) ou d) et comprenant au moins 20 nucleotides, de preference 25, 

30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 
nucleotides : et 
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f) une sequence telle que definie en a), b), c), d) ou e) modifiee, de preference 
comportant au plus 1 0 %, 5 %, 1 % ou 0,5 % de nucleotides modifies par rapport a la 
sequence de reference, 

5 Par acide nucleique, sequence nucleique ou d' acide nucleique, polynucleotide, 

oligonucleotide, sequence de polynucleotide, sequence nucleotidique, termes qui seront 
employes indifferemment dans la presente description, on entend designer un 
enchainement precis de nucleotides, modifies ou non, permettant de definir un fragment 
ou une region d'un acide nucleique, comportant ou non des nucleotides non naturels, et 

10 pouvant correspondre aussi bien a un ADN double brin, un ADN simple brin qu'a des 
produits de transcription desdits ADNs. Ainsi, les sequences nucleiques selon 
Tinvention englobent egalement les PNA (Peptid Nucleic Acid). 

II doit etre compris que la presente invention ne concerne pas les sequences 
nucleotidiques dans leur environnement chromosomique naturel, c'est-a-dire a 1'etat 

15 naturel. II s'agit de sequences qui ont ete isolees et/ou purifiees, c'est-a-dire qu'elles ont 
ete prelevees directement ou indirectement, par exemple par copie, leur environnement 
ayant ete au moins partiellement modifie. On entend ainsi egalement designer les acides 
nucleiques obtenus par synthese chimique. 

Par « pourcentage d'identite » entre deux sequences d'acides nucleiques ou 

20 d'acides amines au sens de la presente invention, on entend designer un pourcentage de 
nucleotides ou de residus d'acides amines identiques entre les deux sequences a 
comparer, obtenu apres le meilleur alignement, ce pourcentage etant purement 
statistique et les differences entre les deux sequences etant reparties au hasard et sur 
toute leur longueur. On entend designer par "meilleur alignement" ou "alignement 

25 optimal", Talignement pour lequel le pourcentage d'identite determine comme ci-apres 
est le plus eleve. Les comparaisons de sequences entre deux sequences d'acides 
nucleiques ou d'acides amines sont traditionnellement realisees en comparant ces 
sequences apres les avoir alignees de maniere optimale, ladite comparaison etant 
realisee par segment ou par « fenetre de comparaison » pour identifier et comparer les 

30 regions locales de similarite de sequence. L' alignement optimal des sequences pour la 
comparaison peut etre realise, outre manuellement, au moyen de l'algorithme 
d'homologie locale de Smith et Waterman (1981, Ad. App. Math. 2:482), au moyen de 
l'algorithme d'homologie locale de Neddleman et Wunsch (1970, J. Mol. Biol. 48:443), 
au moyen de la methode de recherche de similarite de Pearson et Lipman (1988, Proc. 
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Natl. Acad. Sci. USA 85:2444), au moyen de logiciels informatiques utilisant ces 
algorithmes (GAP, BESTFIT, BLAST P, BLAST N, FASTA et TFASTA dans le 
Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., 
Madison, WI). Afm d'obtenir Falignement optimal, on utilise de preference le 
5 programme BLAST, avec la matrice BLOSUM 62. On peut egalement utiliser les 
matrices PAM ou PAM250. 

Le pourcentage d'identite entre deux sequences d'acides nucleiques ou d'acides 
amines est determine en comparant ces deux sequences alignees de maniere optimale, la 
sequence d'acides nucleiques ou d'acides amines a comparer pouvant comprendre des 

1 0 additions ou des deletions par rapport a la sequence de reference pour un alignement 
optimal entre ces deux sequences. Le pourcentage d'identite est calcule en determinant 
le nombre de positions identiques pour lesquelles le nucleotide ou le residu d'acide 
amine est identique dans les deux sequences, en divisant ce nombre de positions 
identiques par le nombre total de positions comparees et en multipliant le resultat 

1 5 obtenu par 100 pour obtenir le pourcentage d'identite entre ces deux sequences. 

Par sequences nucleiques presentant un pourcentage d'identite d'au moins 75 %, 
de preference 80 %, 85 % ou 90 %, de fa?on plus preferee 95 % voire 98 %, apres 
alignement optimal avec une sequence de reference, on entend designer les sequences 
nucleiques presentant, par rapport a la sequence nucleique de reference, certaines 

20 modifications comme en particulier une deletion, une troncation, un allongement, une 
fusion chimerique et/ou une substitution, notamment ponctuelle, et dont la sequence 
nucleique presente au moins 75 %, de preference 80 %, 85 %, 90 %, 95 % ou 98 %, 
d'identite apres alignement optimal avec la sequence nucleique de reference. II s'agit de 
preference de sequences dont les sequences complementaires sont susceptibles de 

25 s'hybrider specifiquement avec les sequences de reference. De preference, les 
conditions d'hybridation specifiques ou de forte stringence seront telles qu'elles 
assurent au moins 75 %, de preference 80 %, 85 %, 90 %, 95 % ou 98 % d'identite 
apres alignement optimal entre l'une des deux sequences et sa sequence 
complementaire. 

30 Une hybridation dans des conditions de forte stringence signifie que les 

conditions de temperature et de force ionique sont choisies de telle maniere qu'elles 
permettent le maintien de l'hybridation entre deux fragments d'ADN complementaires. 
A titre illustratif, des conditions de forte stringence de 1'etape d'hybridation aux fins de 
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definir les fragments polynucleotidiques decrits ci-dessus, sont avantageusement les 
suivantes. 

L'hybridation ADN-ADN ou ADN-ARN est realisee en deux etapes : (1) 
prehybridation a 42°C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) 
5 contenant 5 x SSC (1 x SSC correspond a une solution 0,15 M NaCl + 0 5 0 1 5 M citrate 
de sodium), 50 % de formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x 
Denhardt's, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation 
proprement dite pendant 20 heures a une temperature dependant de la taille de la sonde 
(i.e. : 42°C, pour une sonde de taille > 100 nucleotides) suivie de 2 lavages de 20 
10 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes a 20°C en 0,1 x SSC + 
0,1 % SDS. Le dernier lavage est pratique en 0,1 x SSC + 0,1 % SDS pendant 30 
minutes a 60°C pour une sonde de taille > 100 nucleotides. Les conditions d'hybridation 
de forte stringence decrites ci-dessus pour un polynucleotide de taille definie, peuvent 
etre adaptees par Phomme du metier pour des oligonucleotides de taille plus grande ou 
15 plus petite, selon l'enseignement de Sambrook et al., (1989, Molecular cloning : a 
laboratory manual. 2 Ed. Cold Spring Harbor). 

De plus, par fragment representatif de sequences selon T invention, on entend 
designer tout fragment nucleotidique presentant au moins 1 5 nucleotides, de preference 
au moins 25, 30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 450, 500, 750, 1000 ou 
20 1 500 consecutifs de la sequence dont il est issu. 

Par fragment representatif, on entend en particulier une sequence nucleique 
codant pour un fragment biologiquement actif d'un polypeptide, tel que defini plus loin. 

Par fragment representatif, on entend egalement les sequences intergeniques, et 
en particulier les sequences nucleotidiques portant les signaux de regulation 
25 (promoteurs, terminateurs, voire enhancers, . . .). 

Parmi lesdits fragments representatifs, on prefere ceux ayant des sequences 
nucleotidiques correspondant a des cadres ouverts de lecture, denommes sequences 
ORFs (ORF pour « Open Reading Frame »), compris en general entre un codon 
d' initiation et un codon stop, ou entre deux codons stop, et codant pour des 
30 polypeptides, de preference d'au moins 100 acides amines, tel que par exemple, sans s'y 
limiter, les sequences ORFs qui seront decrites par la suite. 

La numerotation des sequences nucleotidiques ORFs qui sera utilisee par la suite 
dans la presente description correspond a la numerotation des sequences d'acides 
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amines des proteines codees par lesdites ORFs pour les peptides de sequence SEQ ID 
No. 140 a SEQ ID No. 2344 et SEQ ID No.2346 a SEQ ID No.4481. 

Les fragments representatifs selon 1' invention peuvent etre obtenus par exemple 
par amplification specifique telle que la PCR ou apres digestion par des enzymes de 
5 restriction appropries de sequences nucleotidiques selon 1* invention, cette methode etant 
decrite en particulier dans Fouvrage de Sambrook et aL. Lesdits fragments 
representatifs peuvent egalement etre obtenus par synthese chimique lorsque leur taille 
n'est pas trop importante, selon des methodes bien connues de Fhomme du metier. 

Parmi les sequences contenant des sequences de F invention, ou des fragments 
1 0 representatifs, on entend egalement les sequences qui sont naturellement encadrees par 
des sequences qui presentent au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 98 % 
d'identite avec les sequences selon F invention. 

Par sequence nucleotidique modifiee, on entend toute sequence nucleotidique 
obtenue par mutagenese selon des techniques bien connues de Fhomme du metier, et 
15 comportant des modifications par rapport aux sequences normales, par exemple des 
mutations dans les sequences regulatrices et/ou promotrices de Fexpression du 
polypeptide, notamment conduisant a une modification du taux d'expression ou de 
Factivite dudit polypeptide. 

Par sequence nucleotidique modifiee, on entend egalement toute sequence 
20 nucleotidique codant pour un polypeptide modifie tel que definit ci-apres. 

Concernant les sequences nucleiques ou ORF codant pour les peptides de 
sequence SEQ ID No. 2346 a SEQ ID No. 4481, ces sequences nucleiques ou ORF sont 
representees respectivement par les sequences SEQ ID No. 4482 a SEQ ID No. 6617. 

L' invention concerne avantageusement une sequence nucleotidique isolee de 
25 Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi : 

a) une sequence choisie parmi les sequences SEQ ID N° 
6194,6236,5497,5791,5103,4705,5610,5234,4926,6331,6247,5842,5741,4921,5090, 
5180,4706,4708,5677,6246,6411,5578,6446,6447,5607,6209,6215,5406,5658,4965, de 
preference parmi les sequences SEQ ID N°4926,633 1,5491,5234,6246,5842 ; 
30 b) une sequence nucleotidique comportant au moins 75 % d'identite avec une 

sequence nucleotidique du a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique du a) ou b) et comprenant au moins 20 
nucleotides ; 
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d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle 
que definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 

5 f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant 

au plus 1 0 % de nucleotides modifies par rapport a la sequence de reference ; 

et en ce qu'elle code pour une proteine de surface avec un motif d'ancrage 
LPXTG. 

L'invention concerne egalement les polypeptides codes par ces sequences. 
10 L'invention concerne egalement avantageusement une sequence nucleotidique 

isolee de Streptococcus agalactiae caracterisee en ce qu'elle est choisie parmi les 
sequences SEQ ID 

N%035,6137,6335,6377,6386,4495,4596,4636,4730,4816,4836 

5247, 5306,5417,5450,5486,5559,5591,5677,5732,5799,5800,5861,5923 ; et en ce 

15 qu'elle code pour une lipoproteins L'invention concerne egalement les polypeptides 
codes par ces sequences. 

L'invention concerne egalement avantageusement une sequence nucleotidique 
isolee de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi les 
sequences SEQ ID 

20 NM861,6214,6061,6517,6518,6519,4743,6343,6342^ 

5615,5614,5613,561 1,5696,5971 ,5233,5602,5 156,5574,5573,5654,5656,5526,5527,552 
9,5534,5625,5626,6223,6229,6230,6231,6232,6233,5764,6095,5089,5466,5465 ; et en 
ce qu'elle code pour une proteine impliquee dans la biosynthese de composes 
polysaccharidiques de paroi. L'invention concerne egalement les polypeptides codes par 

25 ces sequences. 

Les fragments representatifs selon l'invention peuvent egalement etre des sondes 
ou amorces, qui peuvent etre utilisees dans des procedes de detection, d'identification, 
de dosage ou d' amplification de sequences nucleiques. 

Une sonde ou amorce se definit, au sens de l'invention, comme etant un 

30 fragment d'acides nucleiques simple brin ou un fragment double brin denature 
comprenant par exemple de 12 bases a quelques kb, notamment de 15 a quelques 
centaines de bases, de preference de 15 a 50 ou 100 bases, et possedant une specificite 
d'hybridation dans des conditions determinees pour former un complexe d'hybridation 
avec un acide nucleique cible. 
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Les sondes et amorces selon F invention peuvent etre marquees directement ou 
indirectement par un compose radioactif ou non radioactif par des methodes bien 
connues de Fhomme du metier, afin d'obtenir un signal detectable et/ou quantifiable 
(brevet FR 78 10975 et bDNA de Chiron EP 225 807 et EP 510 085). 
5 Les sequences non marquees de polynucleotides selon Finvention peuvent etre 

utilisees directement comme sonde ou amorce. 

Les sequences sont generalement marquees pour obtenir des sequences 
utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes 
selon Finvention est realise par des elements radioactifs ou par des molecules non 
1 0 radioactives. 

I'J 11 T 

Parmi les isotopes radioactifs utilises, on peut citer le P, le P, le S, le H ou 
le 125 I. Les entites non radioactives sont selectionnees parmi les ligands tels la biotine, 
l'avidine, la streptavidine, la dioxygenine, les haptenes, les colorants, les agents 
luminescents tels que les agents radioluminescents, chemoluminescents, 

1 5 bioluminescents, fluorescents, phosphorescents. 

Les polynucleotides selon Finvention peuvent ainsi etre utilises comme amorce 
et/ou sonde dans des procedes mettant en oeuvre notamment la technique de PCR 
(amplification en chame par polymerase) (Rolfs et al., 1991, Berlin : Springer-Verlag). 
Cette technique necessite le choix de paires d'amorces oligonucleotidiques encadrant le 

20 fragment qui doit etre amplifie. On peut, par exemple, se referer a la technique decrite 
dans le brevet americain U.S. N° 4,683,202. Les fragments amplifies peuvent etre 
identifies, par exemple apres une electrophorese en gel d' agarose ou de polyacrylamide, 
ou apres une technique chromatographique comme la filtration sur gel ou la 
chromatographic echangeuse d'ions, puis sequences. La specificite de F amplification 

25 peut etre controlee en utilisant les sequences nucleotidiques de polynucleotides de 
Finvention comme matrice, des plasmides contenant ces sequences ou encore les 
produits d' amplification derives. Les fragments nucleotidiques amplifies peuvent etre 
utilises comme reactifs dans des reactions d'hybridation afin de mettre en evidence la 
presence, dans un echantillon biologique, d'un acide nucleique cible de sequence 

30 complementaire a celle desdits fragments nucleotidiques amplifies. 

L'invention vise egalement les acides nucleiques susceptibles d'etre obtenus par 
amplification a Faide d'amorces selon l'invention. 

D'autres techniques d' amplification de Facide nucleique cible peuvent etre 
avantageusement employees comme alternative a la PCR (PCR-like) a Faide de couple 
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d 5 amorces de sequences nucleotidiques selon 1' invention. Par PCR-like on entend 
designer toutes les methodes mettant en oeuvre des reproductions directes ou indirectes 
des sequences d'acides nucleiques, ou bien dans lesquelles les systemes de marquage 
ont ete amplifies, ces techniques sont bien entendu connues. En general il s'agit de 
5 P amplification de PADN par une polymerase ; lorsque Pechantillon d'origine est un 
ARN il convient prealablement d'effectuer une transcription reverse. II existe 
actuellement de tres nombreux precedes permettant cette amplification, comme par 
exemple la technique SDA (Strand Displacement Amplification) ou technique 
d'amplification a deplacement de brin (Walker et al., 1992, Nucleic Acids Res. 

10 20:1691), la technique TAS (Transcription-based Amplification System) decrite par 
Kwoh et al. (1989, Proc. Natl. Acad. ScL, USA, 86, 1173), la technique 3SR (Self- 
Sustained Sequence Replication) decrite par Guatelli et al. (1990, Proc. Natl. Acad. Sci., 
USA 87:1874), la technique NASBA (Nucleic Acid Sequence Based Amplification) 
decrite par Kievitis et al. (1991, J. Virol. Methods, 35, 273), la technique TMA 

15 (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) 
decrite par Landegren et al. (1988, Science 241, 1077), la technique de RCR (Repair 
Chain Reaction) decrite par Segev (1992, Kessler C. Springer Verlag, Berlin, New- 
York, 197-205), la technique CPR (Cycling Probe Reaction) decrite par Duck et al. 
(1990, Biotechniques, 9, 142), la technique d' amplification a la Q-beta-replicase decrite 

20 par Miele et al. (1983, J. Mol. Biol., 171, 281). Certaines de ces techniques ont depuis 
ete perfectionnees. 

Dans le cas ou le polynucleotide cible a detecter est un ARNm, on utilise 
avantageusement, prealablement a la mise en oeuvre d'une reaction d' amplification a 
Paide des amorces selon Pinvention ou a la mise en ceuvre d'un precede de detection a 

25 Paide des sondes de Finvention, une enzyme de type transcriptase inverse afin d'obtenir 
un ADNc a partir de l'ARNm contenu dans Pechantillon biologique. L'ADNc obtenu 
servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le precede 
d'amplification ou de detection selon Pinvention. 

La technique d'hybridation de sondes peut etre realisee de manieres diverses 

30 (Matthews et al., 1988, Anal. Biochem., 169, 1-25). La methode la plus generate 
consiste a immobiliser l'acide nucleique extrait des cellules de differents tissus ou de 
cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrene) et 
a incuber, dans des conditions bien definies, l'acide nucleique cible immobilise avec la 
sonde. Apres F hybridation, Pexces de sonde est elimine et les molecules hybrides 
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formees sont detectees par la methode appropriee (mesure de la radioactivite, de la 
fluorescence ou de l'activite enzymatique liee a la sonde). 

Selon un autre mode de mise en oeuvre des sondes nucleiques selon l'invention, 
ces dernieres peuvent etre utilisees comme sondes de capture. Dans ce cas, une sonde, 
5 dite « sonde de capture », est immobilisee sur un support et sert a capturer par 
hybridation specifique l'acide nucleique cible obtenu a partir de l'echantillon biologique 
a tester et l'acide nucleique cible est ensuite detecte grace a une seconde sonde, dite 
« sonde de detection », marquee par un element facilement detectable. 

Parmi les fragments d'acides nucleiques interessants, il faut ainsi citer en 

10 particulier les oligonucleotides anti-sens, c'est-a-dire dont la structure assure, par 
hybridation avec la sequence cible, une inhibition de l'expression du produit 
correspondant. II faut egalement citer les oligonucleotides sens qui, par interaction avec 
des proteines impliquees dans la regulation de l'expression du produit correspondant, 
induiront soit une inhibition, soit une activation de cette expression. 

15 De fa<?on preferee, les sondes ou amorces selon l'invention sont immobilisees 

sur un support, de maniere covalente ou non covalente. En particulier, le support peut 
etre une puce a ADN ou un filtre a haute ou moyenne densite, egalement objets de la 
presente invention (brevets WO 97/29212, WO 98/27317, WO 97/10365 et WO 
92/10588). 

20 On entend designer par puce a ADN ou filtre haute densite, un support sur lequel 

sont fixees des sequences d'ADN, chacune d'entre elles pouvant etre reperee par sa 
localisation geographique. Ces puces ou filtres different principalement par leur taille, le 
materiau du support, et eventuellement le nombre de sequences d'ADN qui y sont 
fixees. 

25 On peut fixer les sondes ou amorces selon la premiere invention sur des supports 

solides, en particulier les puces a ADN, par differents procedes de fabrication. En 
particulier, on peut effectuer une synthese in situ par adressage photochimique ou par jet 
d'encre. D'autres techniques consistent a effectuer une synthese ex situ et a fixer les 
sondes sur le support de la puce a ADN par adressage mecanique, electronique ou par 

30 jet d'encre. Ces differents procedes sont bien connus de l'homme du metier. 

Une sequence nucleotidique (sonde ou amorce) selon Tinvention permet done la 
detection et/ou l'amplification de sequences nucleiques specifiques. En particulier, la 
detection de cesdites sequences est facilitee lorsque la sonde est fixee sur une puce a 
ADN, ou a un filtre haute densite. 
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L'utilisation de puces a ADN ou de filtres a haute densite permet en effet de 
determiner P expression de genes dans un organisme presentant une sequence 
genomique proche de Streptococcus agalactiae et le typage de la souche en cause. 

La sequence genomique de Streptococcus agalactiae, completee par 
5 P identification des genes de ces organismes, telle que presentee dans la presente 
invention, sert de base a la construction de ces puces a ADN ou filtre. 

La preparation de ces filtres ou puces consiste a synthetiser des oligonucleotides, 
correspondant aux extremites 5' et 3' des genes ou a des fragments plus internes pour 
amplifier des fragments d'une taille adaptee, par exemple comprise environ entre 300 et 

10 800 bases. Ces oligonucleotides sont choisis en utilisant la sequence genomique et ses 
annotations divulguees par la presente invention. La temperature d'appariement des ces 
oligonucleotides aux places correspondantes sur l'ADN doit etre approximativement la 
meme pour chaque oligonucleotide. Ceci permet de preparer des fragments d'ADN 
correspondant a chaque gene par l'utilisation de conditions de PCR appropriees dans un 

1 5 environnement hautement automatise. Les fragments amplifies sont ensuite immobilises 
sur des filtres ou des supports en verre, silicium ou polymeres synthetiques et ces 
milieux sont utilises pour Phybridation. 

La disponibilite de tels filtres et/ou puces et de la sequence genomique 
correspondante annotee permet d'etudier l'expression de grands ensembles, voire de la 

20 totalite des genes dans les micro-organismes associes a Streptococcus agalactiae et 
Streptococcus agalactiae CIP 82.45 (ATCC 12403), en preparant les ADNs 
complementaires, et en les hybridant a l'ADN ou aux oligonucleotides immobilises sur 
les filtres ou les puces. De meme, les filtres et/ou les puces permettent d'etudier la 
variability des souches ou des especes, en preparant l'ADN de ces organismes et en les 

25 hybridant a l'ADN ou aux oligonucleotides immobilises sur les filtres ou les puces. 

Les differences entre les sequences genomiques des differentes souches ou 
especes peuvent grandement affecter l'intensite de Thybridation et, par consequent, 
perturber Interpretation des resultats. II peut done etre necessaire d'avoir la sequence 
precise des genes de la souche que Ton souhaite etudier. La methode de detection des 

30 genes decrite plus loin en detail, impliquant la determination de la sequence de 
fragments aleatoires d'un genome, et les organisant d'apres la sequence du genome de 
Streptococcus agalactiae, notamment de Streptococcus agalactiae CIP 82.45 (ATCC 
12403) divulguee dans la presente invention, peut etre tres utile. 
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Les sequences nucleotidiques selon T invention peuvent etre utilisees dans des 
puces a ADN pour effectuer F analyse de mutations. Cette analyse repose sur la 
constitution de puces capables d'analyser chaque base d'une sequence nucleotidique 
selon l'invention. On pourra notamment a cette fin mettre en oeuvre les techniques de 
5 microsequen?age sur puce a ADN. Les mutations sont detectees par extension 
d'amorces immobilisees hybridant a la matrice des sequences analysees, juste en 
position adjacente de celle du nucleotide mute recherche. Une matrice simple brin, ARN 
ou ADN, des sequences a analyser sera avantageusement preparee selon des methodes 
classiques, a partir de produits amplifies selon les techniques de type PCR. Les matrices 

1 0 d'ADN simple brin, ou d'ARN ainsi obtenues sont alors deposees sur la puce a ADN, 
dans des conditions permettant leur hybridation specifique aux amorces immobilisees. 
Une polymerase thermostable, par exemple la Tth ou la Taq ADN polymerase, etend 
specifiquement Textremite 3* de 1'amorce immobilisee avec un analogue de nucleotide 
marque complementaire du nucleotide en position du site variable ; par exemple, un 

1 5 cyclage thermique est realise en presence des dideoxyribonucleotides fluorescents. Les 
conditions experimentales seront adaptees notamment aux puces employees, aux 
amorces immobilisees, aux polymerases employees, et au systeme de marquage choisi. 
Un avantage du microsequen9age, par rapport aux techniques basees sur l'hybridation 
de sondes, est qu'il permet d'identifier tous les nucleotides variables avec une 

20 discrimination optimale dans des conditions de reactions homogenes ; utilise sur des 
puces a ADN, il permet une resolution et une specificite optimales pour la detection 
routiniere et industrielle de mutations en multiplex. 

Une puce a ADN ou un filtre peut etre un outil extremement interessant pour la 
determination, la detection et/ou 1' identification d'un micro-organisme. Ainsi, on 

25 prefere egalement les puces a ADN selon l'invention qui contiennent en outre au moins 
une sequence nucleotidique d'un micro-organisme autre que Streptococcus agalactiae 
CIP 82.45 (ATCC 12403) ou Streptococcus agalactiae, immobilisee sur le support de 
ladite puce. De preference, le micro-organisme choisi Test parmi les bacteries du genre 
Streptococcus (ci-apres designees comme bacteries associees a Streptococcus 

30 agalactiae), ou les variants de Streptococcus agalactiae CIP 82.45 (ATCC 12403). 

Une puce a ADN ou un filtre selon l'invention est un element tres utile de 
certains kits ou necessaires pour la detection et/ou 1' identification de micro-organismes, 
en particulier les bacteries appartenant a l'espece Streptococcus agalactiae ou les 
micro-organismes associes, egalement objets de l'invention. 
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Par ailleurs, les puces a ADN ou les filtres selon P invention, contenant des 
sondes ou amorces specifiques de Streptococcus agalactiae, sont des elements tres 
avantageux de kits ou necessaires pour la detection et/ou la quantification de 
Pexpression de genes de Streptococcus agalactiae (ou de micro-organismes associes). 
5 En effet, le controle de Texpression des genes est un point critique pour 

optimiser la croissance et le rendement d'une souche, soit en permettant Pexpression 
d'un ou plusieurs genes nouveaux, soit en modifiant Texpression de genes deja presents 
dans la cellule. La presente invention fournit Tensemble des sequences naturellement 
actives chez Streptococcus agalactiae permettant Texpression des genes. Elle permet 

10 ainsi la determination de Tensemble des sequences exprimees chez Streptococcus 
agalactiae. Elle fournit egalement un outil permettant de reperer les genes dont 
Texpression suit un schema donne. Pour realiser cela, P ADN de tout ou partie des genes 
de Streptococcus agalactiae peut etre amplifie grace a des amorces selon Tinvention, 
puis fixe a un support comme par exemple le verre ou le nylon ou une puce a ADN, afin 

15 de construire un outil permettant de suivre le profil d'expression de ces genes. Cet outil, 
constitue de ce support contenant les sequences codantes sert de matrice d'hybridation a 
un melange de molecules marquees refletant les ARNs messagers exprimes dans la 
cellule (en particulier les sondes marquees selon Pinvention). En repetant cette 
experience a differents instants et en combinant Tensemble de ces donnees par un 

20 traitement approprie, on obtient alors les profils d'expression de Tensemble de ces 
genes. La connaissance des sequences qui suivent un schema de regulation donne peut 
aussi etre mise a profit pour rechercher de maniere dirigee, par exemple par homologie, 
d'autres sequences suivant globalement, mais de maniere legerement differente le meme 
schema de regulation. En complement, il est possible d'isoler chaque sequence de 

25 controle presente en amont des segments servant de sondes et d*en suivre Tactivite a 
Taide de moyen approprie comme un gene rapporteur (luciferase, P-galactosidase, 
GFP). Ces sequences isolees peuvent ensuite etre modifiees et assemblees par ingenierie 
metabolique avec des sequences d'interet en vue de leur expression optimale. 

L'invention concerne egalement les polypeptides codes par une sequence 

30 nucleotidique selon Pinvention, de preference, par un fragment representatif des 
sequences precedentes et correspondant a une sequence ORF. En particulier, les 
polypeptides de Streptococcus agalactiae CIP 82.45 (ATCC 12403) de SEQ ID No. 140 
a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 sont objet de Pinvention. 
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L'invention comprend egalement les polypeptides caracterises en ce qu'ils 
comprennent un polypeptide choisi parmi : 

a) un polypeptide selon l'invention ; 

b) un polypeptide presentant au moins 80 % de preference 85 %, 90 %, 95 % et 98 % 
5 d'identite avec un polypeptide selon Finvention ; 

c) un fragment d'au moins 5 acides amines, de preference d'au moins 10, 15, 20, 25, 
30, 40, 50, 75 et 100 acides amines d'un polypeptide selon l'invention, ou tel que 
defini en b) ; 

d) un fragment biologiquement actif d'un polypeptide selon l'invention, ou tel que 
1 0 defini en b) ou c) ; et 

e) un polypeptide selon l'invention, ou tel que defini en b), c) ou d) modifie et 
comportant au plus 10 %, 5 % ou 1 % d'acides amines modifies par rapport a la 
sequence de reference. 

Les sequences nucleotidiques codant pour les polypeptides decrits 
1 5 precedemment sont egalement objet de l'invention. 

Dans la presente description, les termes polypeptides, sequences 
polypeptidiques, peptides et proteines sont interchangeables. Le terme polypeptide 
comprend toute sequence d'acides amines permettant de generer une reponse anticorps. 

II doit etre compris que l'invention ne concerne pas les polypeptides sous forme 
20 naturelle, c'est-a-dire qu'ils ne sont pas pris dans leur environnement naturel. En 
revanche, elle concerne ceux qui ont pu etre isoles ou obtenus par purification a partir 
de sources naturelles, ou bien obtenus par recombinaison genetique, ou par synthese 
chimique, et qu'ils peuvent alors comporter des acides amines non naturels comme cela 
sera decrit plus loin. 

25 Par polypeptide presentant un certain pourcentage d'identite avec un autre, que 

Ton designera egalement par polypeptide homologue, on entend designer les 
polypeptides presentant par rapport aux polypeptides naturels, certaines modifications, 
en particulier une deletion, addition ou substitution d'au moins un acide amine, une 
troncation, un allongement, une solution chimerique et/ou une mutation, ou les 

30 polypeptides presentant des modifications post-traductionnelles. Parmi les polypeptides 
homologues, on prefere ceux dont la sequence d'acides amines presentent au moins 
80%, de preference 85 %, 90 %, 95 % et 98 % d'homologie avec les sequences 
d'acides amines des polypeptides selon l'invention. Dans le cas d'une substitution, un 
ou plusieurs acide(s) amine(s) consecutif(s) ou non consecutif(s) sont remplaces par des 
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acides amines « equivalents ». L'expression « acides amines equivalents » vise ici a 
designer tout acide amine susceptible d'etre substitue a Tun des acides amines de la 
structure de base sans cependant modifier essentiellement les activites biologiques des 
peptides correspondant telles qu'elles seront definies par la suite. 
5 Ces acides amines equivalents peuvent etre determines soit en s'appuyant sur 

leur homologie de structure avec les acides amines auxquels ils se substituent, soit sur 
des resultats d'essais comparatifs d'activite biologique entre les differents polypeptides 
susceptibles d'etre effectues. 

A titre d'exemple, on mentionne les possibilites de substitution susceptibles 

10 d'etre effectuees sans qu'il resulte en une modification approfondie de l'activite 
biologique du polypeptide modifie correspondant. On peut remplacer ainsi la leucine 
par la valine ou l'isoleucine, 1'acide aspartique par 1'acide glutamine, la glutamine par 
1'asparagine, l'arginine par la lysine, etc., les substitutions inverses etant naturellement 
envisageables dans les memes conditions. 

1 5 Les polypeptides homologues correspondent egalement aux polypeptides codes 

par les sequences nucleotidiques homologues ou identiques, telles que definies 
precedemment et comprennent ainsi dans la presente definition des polypeptides mutes 
ou correspondant a des variations inter ou intra especes, pouvant exister chez 
Streptococcus, et qui correspondent notamment a des troncatures, substitutions, 

20 deletions et/ou additions, d'au moins un residu d'acides amines. 

II est entendu que Ton calcule le pourcentage d'identite entre deux polypeptides 
de la meme fa?on qu'entre deux sequences d'acides nucleiques. Ainsi, le pourcentage 
d'identite entre deux polypeptides est calcule apres alignement optimal de ces deux 
sequences, sur une fenetre d'homologie maximale. Pour definir ladite fenetre 

25 d'homologie maximale, on peut utiliser les memes algorithmes que pour les sequences 
d'acide nucleique. 

Par fragment biologiquement actif d'un polypeptide selon 1' invention, on entend 
designer en particulier un fragment de polypeptide, tel que defini ci-apres, presentant au 
moins une des caracteristiques biologiques des polypeptides selon l'invention, 
30 notamment en ce qu'il est capable d'exercer de maniere generale une activite meme 
partielle, telle que par exemple : 

- une activite enzymatique (metabolique) ou une activite pouvant etre 
impliquee dans la biosynthese ou la biodegradation de composes organiques ou 
inorganiques ; 
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- une activite structurelle (enveloppe cellulaire, molecule chaperonne, 
ribosome) ; 

- une activite de transport (d'energie, d'ion) ; ou dans la secretion de proteine ; 

- une activite dans le processus de replication, amplification, preparation, 
5 transcription, traduction ou maturation, notamment de FADN, de FARN ou des 

proteines. 

Par fragment de polypeptide selon Finvention, on entend designer un 
polypeptide comportant au minimum 5 acides amines, de preference d'au moins 10, 15, 
20, 25, 30, 40, 50, 75, 100 et 150 acides amines. 

1 0 Les fragments de polypeptides peuvent corresponds a des fragments isoles ou 

purifies naturellement presents dans les souches de Streptococcus, ou a des fragments 
qui peuvent etre obtenus par clivage dudit polypeptide par une enzyme proteolitique 
telle que la trypsine ou la chymotrypsine ou la collagenase, par un reactif chimique 
(bromure de cyanogene, CNBr) ou en pla?ant ledit polypeptide dans un environnement 

1 5 tres acide (par exemple a pH = 2,5). Des fragments polypeptidiques peuvent egalement 
etre prepares par synthese chimique, a partir d'hotes transformes par un vecteur 
d'expression selon Tinvention qui contiennent un acide nucleique permettant 
F expression dudit fragment, et place sous le controle des elements de regulation et/ou 
d'expression appropries. 

20 Par « polypeptide modifie » d'un polypeptide selon F invention, on entend 

designer un polypeptide obtenu par recombinaison genetique ou par synthese chimique 
comme decrit plus loin, qui presente au moins une modification par rapport a la 
sequence normale. Ces modifications peuvent etre notamment portees sur des acides 
amines necessaires pour la specificite ou Fefficacite de Factivite, ou a Forigine de la 

25 conformation structurale, de la charge, ou de Fhydrophobicite du polypeptide selon 
Finvention. On peut ainsi creer des polypeptides d'activite equivalente, augmentee ou 
diminuee, ou de specificite equivalente, plus etroite ou plus large. Parmi les 
polypeptides modifies, il faut citer les polypeptides dans lesquels jusqu'a cinq acides 
amines peuvent etre modifies, tronques a Fextremite N ou C-terminale, ou bien deletes, 

30 ou ajoutes. 

Comme cela est indique, les modifications d'un polypeptide ont pour objectif 
notamment : 

- de permettre sa mise en ceuvre dans des procedes de biosynthese ou de 
biodegradation de composes organiques ou inorganiques, 
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- de permettre sa mise en oeuvre dans des procedes de replication, 
d'amplification, de reparation et regie de transcription, de traduction, ou de maturation 
notamment de l'ADN, TARN, ou de proteines, 

- de permettre sa secretion amelioree, 

5 -de modifier sa solubilite, l'efficacite ou la specificite de son activite, ou 

encore de faciliter sa purification. 

La synthese chimique presente egalement l'avantage de pouvoir utiliser des 
acides amines non naturels ou des liaisons non peptidiques. Ainsi, il peut etre 
interessant d'utiliser des acides amines non naturels, par exemple sous forme D, ou des 
1 0 analogues d'acides amines, notamment des formes souffrees. 

La presente invention fournit la sequence nucleotidique du genome de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) sous forme de contigs, ainsi que 
certaines sequences polypeptidiques. 

D'une maniere preferee, 1' invention est relative a une sequence nucleotidique 
15 selon Finvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
biosynthese des acides amines. 

De maniere preferee, l'invention est relative a une sequence nucleotidique selon 
T invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
20 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
biosynthese des cofacteurs, groupes prosthetiques et transporters. 

De maniere preferee, 1' invention est relative a une sequence nucleotidique selon 
1' invention, caracterisee en ce qu'elle code pour un polypeptide d'enveloppe cellulaire 
ou present a la surface de Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou pour 
25 un de ses fragments. 

De maniere preferee, 1' invention est relative a une sequence nucleotidique selon 
l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
machinerie cellulaire. 

30 De maniere preferee, l'invention est relative a une sequence nucleotidique selon 

l'invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme intermediate central. 
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De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme energetique. 
5 De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 

Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme des acides gras et des phospholipides. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
10 Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme des nucleotides, des purines, des pyrimidines ou nucleosides. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
15 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans les 
fonctions de regulation. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
20 de replication. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de transcription. 

25 De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 

Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de traduction. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
30 Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de transport et de liaison des proteines. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
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agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans Fadaptation 
aux conditions atypiques. 

De maniere preferee, P invention est relative a une sequence nucleotidique selon 
Finvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
5 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments dans la sensibilite aux 
medicaments et analogues. 

De maniere preferee, Finvention est relative a une sequence nucleotidique selon 
F invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans les 
1 0 fonctions relatives aux transposons. 

De maniere preferee, Finvention est relative a une sequence nucleotidique selon 
Finvention, caracterisee en ce qu'elle code pour un polypeptide specifique de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
15 polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la biosynthese des acides amines. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
20 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la biosynthese des cofacteurs, groupes prosthetiques et transporters. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide 
d'enveloppe cellulaire ou de surface de Streptococcus agalactiae CIP 82.45 (ATCC 
25 12403) ou un de ses fragments. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la machinerie cellulaire. 
30 Sous un autre aspect, de maniere preferee, Finvention a pour objet un 

polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme intermediaire central. 
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Sous un autre aspect, de maniere preferee, 1' invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme energetique. 
5 Sous un autre aspect, de maniere preferee, l'invention a pour objet un 

polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme des acides gras et des phospholipides. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
10 polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme des nucleotides, des purines, des pyrimidines ou nucleosides. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
15 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans les fonctions de regulation. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
20 dans le processus de replication. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de transcription. 
25 Sous un autre aspect, de maniere preferee, l'invention a pour objet un 

polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de traduction. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
30 polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de transport et de liaison des proteines. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
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Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans l'adaptation aux conditions atypiques. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
5 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments dans la 
sensibilite aux medicaments et analogues. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
1 0 dans les fonctions relatives aux transposons. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide specifique 
de Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments. 

L' invention a egalement pour objet les operons impliques dans la synthese 
1 5 d'antibiotiques et/ou de toxines. 

Le tableau 1 fournit la liste de certains polypeptides selon Finvention, ainsi que 
leur localisation dans les sequences SEQ ID No. 1 a SEQ ID No. 139, et les analogies 
observees apres comparaison dans les bases de donnees. 

20 II est important de noter toutefois qu'un organisme vivant est un tout et doit etre 

pris comme tel. Ainsi, afin de pouvoir se developper et exhiber ses proprietes, tout 
organisme a besoin d' interactions entre les differentes voies metaboliques. Ainsi, la 
classification enoncee ci-dessus ne doit pas etre consideree comme limitative, un gene 
pouvant etre implique dans deux voies metaboliques distinctes. 

25 La presente invention a egalement pour objet les sequences nucleotidiques et/ou 

de polypeptides selon Finvention, caracterisees en ce que lesdites sequences sont 
enregistrees sur un support d'enregistrement dont la forme et la nature facilitent la 
lecture, Panalyse et/ou l'exploitation de ladite ou desdites sequence(s). Ces supports 
peuvent egalement contenir d'autres informations extraites de la presente invention, 

30 notamment les analogies avec des sequences deja connues, et/ou des informations 
concernant les sequences nucleotidiques et/ou de polypeptides d'autres micro- 
organismes afin de faciliter Fanalyse comparative et l'exploitation des resultats obtenus. 

Parmi cesdits supports d'enregistrement, on prefere en particulier les supports 
lisibles par un ordinateur, tels les supports magnetiques, optiques, electriques ou 
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hybrides, en particulier les disquettes informatiques, les CD-ROM, les serveurs 
informatiques. De tels supports d'enregistrement sont egalement objet de l'invention. 

Les supports d'enregistrement selon l'invention, avec les informations 
apportees, sont tres utiles pour le choix d' amorces ou de sondes nucleotidiques pour la 
5 determination de genes dans Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou 
souches proches de cet organisme. De meme, Futilisation de ces supports pour l'etude 
du polymorphisme genetique de souches proches de Streptococcus agalactiae CIP 
82.45 (ATCC 12403), en particulier par la determination des regions de colinearite, est 
tres utile dans la mesure ou ces supports fournissent non seulement la sequence 
10 nucleotidique du genome de Streptococcus agalactiae CIP 82.45 (ATCC 12403), mais 
egalement l'organisation genomique dans ladite sequence. Ainsi, les utilisations de 
supports d'enregistrement selon 1'invention sont egalement des objets de l'invention. 

L'analyse d'homologie entre differentes sequences s'effectue en effet 
avantageusement a l'aide de logiciels de comparaison de sequences, tels le logiciel 
1 5 Blast, ou les logiciels de la trousse GCG, decrits precedemment. 

L'invention vise egalement les vecteurs de clonage et/ou d'expression, qui 
contiennent une sequence nucleotidique selon l'invention. 

Les vecteurs selon l'invention comportent de preference des elements qui 
permettent 1' expression et/ou la secretion des sequences nucleotidiques dans une cellule 
20 hote determinee. 

Le vecteur doit alors comporter un promoteur, des signaux d' initiation et de 
terminaison de la traduction, ainsi que des regions appropriees de regulation de la 
transcription. II doit pouvoir etre maintenu de fa(?on stable dans la cellule hote et peut 
eventuellement posseder des signaux particuliers qui specifient la secretion de la 
25 proteine traduite. Ces differents elements sont choisis et optimises par Fhomme du 
metier en fonction de l'hote cellulaire utilise. A cet effet, les sequences nucleotidiques 
selon l'invention peuvent etre inserees dans des vecteurs a replication autonome au sein 
de l'hote choisi, ou etre des vecteurs integratifs de l'hote choisi. 

De tels vecteurs sont prepares par des methodes couramment utilisees par 
30 l'homme du metier, et les clones resultant peuvent etre introduits dans un hote approprie 
par des methodes standards, telles que la lipofection, l'electroporation, le choc 
thermique, ou des methodes chimiques. 
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Les vecteurs selon Pinvention sont par exemple des vecteurs d'origine 
plasmidique ou virale. lis sont utiles pour transformer des cellules hotes afin de cloner 
ou d'exprimer les sequences nucleotidiques selon Pinvention. 

L' invention comprend egalement les cellules hotes transformees par un vecteur 
5 selon P invention. 

L'hote cellulaire peut etre choisi parmi des systemes procaryotes ou eucaryotes, 
par exemple les cellules bacteriennes mais egalement les cellules de levure ou les 
cellules animates, en particulier les cellules de mammiferes. On peut egalement utiliser 
des cellules d'insectes ou des cellules de plantes. Les cellules hotes preferees selon 
10 l'invention sont en particulier les cellules procaryotes, de preference les bacteries 
appartenant au genre Streptococcus, a l'espece Streptococcus agalactiae, plus 
particulierement Streptococcus agalactiae CIP 82.45 (ATCC 12403), ou les micro- 
organismes associes a l'espece Streptococcus agalactiae. 

L'invention concerne egalement les vegetaux et les animaux, excepte Phomme, 
15 qui comprennent une cellule transformee selon Pinvention. Les cellules transformees 
selon Pinvention sont utilisables dans des procedes de preparation de polypeptides 
recombinants selon l'invention. Les procedes de preparation d'un polypeptide selon 
Pinvention sous forme recombinante, caracterises en ce qu'ils mettent en oeuvre un 
vecteur et/ou une cellule transformee par un vecteur selon Pinvention sont eux-memes 
20 compris dans la presente invention. De preference, on cultive une cellule transformee 
par un vecteur selon Pinvention dans des conditions qui permettent P expression dudit 
polypeptide et on recupere ledit peptide recombinant. 

Ainsi qu'il a ete dit, Phote cellulaire peut etre choisi parmi des systemes 
procaryotes ou eucaryotes. En particulier, il est possible d' identifier des sequences 
25 nucleotidiques selon l'invention, facilitant la secretion dans un tel systeme procaryote 
ou eucaryote. Un vecteur selon Pinvention portant une telle sequence peut done etre 
avantageusement utilise pour la production de proteines recombinantes, destinees a etre 
secretees. En effet, la purification de ces proteines recombinantes d'interet sera facilitee 
par le fait qu'elles sont presentent dans le surnageant de la culture cellulaire plutot qu'a 
30 Pinterieur des cellules hotes. 

On peut egalement preparer les polypeptides selon Pinvention par synthese 
chimique. Un tel procede de preparation est egalement un objet de Pinvention. 
L'homme du metier connait les procedes de synthese chimique, par exemple les 
techniques mettant en oeuvre des phases solides (voir notamment Steward et al., 1984, 
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Solid phase peptides synthesis, Pierce Chem. Company, Rockford, 111, 2eme ed., 
(1984)) ou des techniques utilisant des phases solides partielles, par condensation de 
fragments ou par une synthese en solution classique. Les polypeptides obtenus par 
synthese chimique et pouvant comporter des acides amines non naturels correspondants 
5 sont egalement compris dans l'invention. 

L' invention est en outre relative a des polypeptides hybrides presentant au moins 
un polypeptide ou un de ses fragments selon l'invention, et une sequence d'un 
polypeptide susceptible d'induire une reponse immunitaire chez Phomme ou 1' animal. 

Avantageusement, le determinant antigenique est tel qu'il est susceptible 
1 0 d'induire une reponse humorale et/ou cellulaire. 

Un tel determinant pourra comprendre un polypeptide ou un de ses fragments 
selon l'invention sous forme glycosylee, utilise en vue d'obtenir des compositions 
immunogenes susceptibles d'induire la synthese d'anticorps diriges contre des epitopes 
multiples. Lesdits polypeptides ou leurs fragments glycosyles font egalement partie de 
15 l'invention. 

Ces molecules hybrides peuvent etre constitutes en partie d'une molecule 
porteuse de polypeptides ou de leurs fragments selon l'invention, associee a une partie 
eventuellement immunogene, en particulier un epitope de la toxine diphterique, la 
toxine tetanique, un antigene de surface du virus de 1'hepatite B (brevet FR 79 2181 1), 
20 l'antigene VP1 du virus de la poliomyelite ou toute autre toxine ou antigene viral ou 
bacterien. 

Les precedes de synthese des molecules hybrides englobent les methodes 
utilisees en genie genetique pour construire des sequences nucleotidiques hybrides 
codant pour les sequences polypeptidiques recherchees. On pourra, par exemple, se 
25 referer avantageusement a la technique d'obtention de genes codant pour des proteines 
de fusion decrite par Minton en 1984. 

Lesdites sequences nucleotidiques hybrides codant pour un polypeptide hybride 
ainsi que les polypeptides hybrides selon l'invention, caracterises en ce qu'il s'agit de 
polypeptides recombinants obtenus par l'expression desdites sequences nucleotidiques 
30 hybrides, font egalement partie de l'invention. 

L'invention comprend egalement les vecteurs caracterises en ce qu'ils 
contiennent une desdites sequences nucleotidiques hybrides. Les cellules hotes 
transformees par lesdits vecteurs, les animaux transgeniques comprenant une desdites 
cellules transformees ainsi que les procedes de preparation de polypeptides 
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recombinants utilisant lesdits vecteurs, lesdites cellules transformees et/ou lesdits 
animaux transgeniques font egalement partie de P invention. 

Le couplage entre un polypeptide selon P invention et un polypeptide 
immunogene peut etre effectue par voie chimique, ou par voie biologique. Ainsi, selon 
5 Pinvention, il est possible d'introduire un ou plusieurs element(s) de liaison, notamment 
des acides amines pour faciliter les reactions de couplage entre le polypeptide selon 
Pinvention, et le polypeptide immunostimulateur, le couplage covalent de Pantigene 
immunostimulateur pouvant etre realise a Pextremite N ou C-terminale du polypeptide 
selon Pinvention. Les reactifs bifonctionnels permettant ce couplage sont determines en 

10 fonction de Pextremite choisie pour realiser ce couplage, et les techniques de couplage 
sont bien connues de Phomme du metier. 

Les conjugues issus d'un couplage de peptides peuvent etre egalement prepares 
par recombinaison genetique. Le peptide hybride (conjugue) peut en effet etre produit 
par des techniques d' ADN recombinant, par insertion ou addition a la sequence d'ADN 

15 codant pour le polypeptide selon Pinvention, d'une sequence codant pour le ou les 
peptide(s) antigene(s), immunogene(s) ou haptene(s). Ces techniques de preparation de 
peptides hybrides par recombinaison genetique sont bien connues de Phomme du metier 
(voir par exemple Makrides, 1996, Microbiological Reviews 60,512-538). 

De preference, ledit polypeptide immunitaire est choisi dans le groupe des 

20 peptides contenant les anatoxines, notamment le toxoide diphterique ou le toxoYde 
tetanique, les proteines derivees du Streptocoque (comme la proteine de liaison a la 
seralbumine humaine), les proteines membranaires OMPA et les complexes de 
proteines de membranes externes, les vesicules de membranes externes ou les proteines 
de chocs thermiques. 

25 Les polypeptides hybrides selon Pinvention sont tres utiles pour obtenir des 

anticorps monoclonaux ou polyclonaux, capables de reconnaitre specifiquement les 
polypeptides selon Pinvention. En effet, un polypeptide hybride selon Pinvention 
permet la potentialisation de la reponse immunitaire, contre le polypeptide selon 
Pinvention couple a la molecule immunogene. De tels anticorps monoclonaux ou 

30 polyclonaux, leurs fragments, ou les anticorps chimeriques, reconnaissant les 
polypeptides selon Pinvention, sont egalement objet de Pinvention. 

Les anticorps monoclonaux specifiques peuvent etre obtenus selon la methode 
classique de culture d'hybridome decrite par Kohler et Milstein (1975, Nature 256, 
495). 
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Les anticorps selon 1' invention sont par exemple des anticorps chimeriques, des 
anticorps humanises, des fragments Fab, ou F(ab') . lis peuvent egalement se presenter 
sous forme d'immunoconjugues ou d'anticorps marques afin d'obtenir un signal 
detectable et/ou quantifiable. 
5 Ainsi, les anticorps selon Finvention peuvent etre employes dans un procede 

pour la detection et/ou F identification de bacteries appartenant a Fespece Streptococcus 
agalactiae ou a un micro-organisme associe dans un echantillon biologique, caracterise 
en ce qu'il comprend les etapes suivantes: 

a) mise en contact de Fechantillon biologique avec un anticorps selon Finvention ; 

10 b) mise en evidence du complexe antigene-anticorps eventuellement forme. 

Les anticorps selon la presente invention sont egalement utilisables afin de 
detecter une expression d'un gene de Streptococcus agalactiae ou de micro-organismes 
associes. En effet, la presence du produit d' expression d'un gene reconnu par un 
anticorps specifique dudit produit d'expression peut etre detectee par la presence d'un 

15 complexe antigene-anticorps forme apres la mise en contact de la souche de 
Streptococcus agalactiae ou du micro-organisme associe avec un anticorps selon 
Finvention. La souche bacterienne utilisee peut avoir ete « preparee », c'est-a-dire 
centrifugee, lysee, placee dans un reactif approprie pour la constitution du milieu 
propice a la reaction immunologique. En particulier, on prefere un procede de detection 

20 de F expression dans le gene, correspondant a un Western blot, pouvant etre effectue 
apres une electrophorese sur gel de polyacrylamide d'un lysat de la souche bacterienne, 
en presence ou en F absence de conditions reductrices (SDS-PAGE). Apres migration et 
separation des proteines sur le gel de polyacrylamide, on transfere lesdites proteines sur 
une membrane appropriee (par exemple en nylon) et on detecte la presence de la 

25 proteine ou du polypeptide d'interet, par mise en contact de ladite membrane avec un 
anticorps selon Finvention. 

Ainsi, la presente invention comprend egalement les kits ou necessaires pour la 
mise en oeuvre d'un procede tel que decrit (de detection de l'expression d'un gene de 
Streptococcus agalactiae ou d'un micro-organisme associe, ou pour la detection et/ou 

30 F identification de bacteries appartenant a Fespece Streptococcus agalactiae ou un 
micro-organisme associe), comprenant les elements suivants : 

a) un anticorps polyclonal ou monoclonal selon Finvention ; 

b) eventuellement, les reactifs pour la constitution du milieu propice a la reaction 
immunologique ; 
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c) eventuellement, les reactifs permettant la mise en evidence des complexes antigene- 
anticorps produits par la reaction immunologique. 

Les polypeptides et les anticorps selon 1' invention peuvent avantageusement etre 
immobilises sur un support, notamment une puce a proteines. Une telle puce a proteines 
5 est un objet de Pinvention, et peut egalement contenir au moins un polypeptide d'un 
micro-organisme autre que Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un 
anticorps dirige contre un compose d'un micro-organisme autre que Streptococcus 
agalactiae CIP 82.45 (ATCC 12403). 

Les puces a proteines ou filtres a haute densite contenant des proteines selon 
10 P invention peuvent etre construites de la meme maniere que les puces a ADN selon 
Pinvention. En pratique, on peut effectuer la synthese des polypeptides directement 
fixes sur la puce a proteines, ou effectuer une synthese ex situ suivie d'une etape de 
fixation sur ladite puce du polypeptide synthetise. Cette derniere methode est preferable, 
lorsque Pon desire fixer des proteines de taille importante sur le support, ces proteines 
1 5 etant avantageusement preparees par genie genetique. Toutefois, si Pon ne desire fixer 
que des peptides sur le support de ladite puce, il peut etre plus interessant de proceder a 
la synthese desdits peptides directement in situ. 

Les puces a proteines selon Pinvention peuvent etre avantageusement utilisees 
dans des kits ou necessaires pour la detection et/ou P identification de bacteries 
20 associees a Pespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un micro- 
organisme, ou de fa?on plus generate dans des kits ou necessaires pour la detection 
et/ou P identification de micro-organismes. Lorsque Pon fixe les polypeptides selon 
Pinvention sur les puces a ADN, on recherche la presence d'anticorps dans les 
echantillons testes, la fixation d'un anticorps selon Pinvention sur le support de la puce 
25 a proteines permettant P identification de la proteine dont ledit anticorps est specifique. 

De preference, on fixe un anticorps selon Pinvention sur le support de la puce a 
proteines, et on detecte la presence de Pantigene correspondant, specifique de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou d'un micro-organisme associe. 

Une puce a proteines ci-dessus decrite peut etre utilisee pour la detection de 
30 produits de genes, pour etablir un profil d' expression desdits genes, en complement 
d'une puce a ADN selon Pinvention. 

Les puces a proteines selon Pinvention sont egalement extremement utiles pour 
les experiences de proteomique, qui etudie les interactions entre les differentes proteines 
d'un micro-organisme donne. De fa<?on simplifiee, on fixe des peptides representatifs 
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des differentes proteines d'un organisme sur un support. Puis, on met ledit support en 
contact avec des proteines marquees, et apres une etape optionnelle de rin9age, on 
detecte des interactions entre Iesdites proteines marquees et les peptides fixes sur la 
puce a proteines. 

5 Ainsi, les puces a proteines comprenant une sequence polypeptidique selon 

T invention ou un anticorps selon V invention sont objet de 1' invention, ainsi que les kits 
ou necessaires les contenant. 

La presente invention couvre egalement un procede de detection et/ou 
d' identification de bacteries appartenant a Pespece Streptococcus agalactiae CIP 82.45 
10 (ATCC 12403) ou a un micro-organisme associe dans un echantillon biologique, qui 
met en oeuvre une sequence nucleotidique selon l'invention. 

II doit etre entendu que le terme echantillon biologique concerne dans la 
presente invention les echantillons preleves a partir d'un organisme vivant (en 
particulier sang, tissus, organes ou autres preleves a partir d'un mammifere) ou un 
15 echantillon contenant du materiel biologique, c'est-a-dire de l'ADN ou de TARN. Un 
tel echantillon biologique comprend aussi les compositions alimentaires contenant des 
bacteries (par exemple les fromages, les produits laitiers), mais egalement des 
compositions alimentaires contenant des levures (bieres, pains) ou autres. Le terme 
echantillon biologique concerne aussi les bacteries isolees a partir de ces prelevements 
20 ou compositions alimentaires. 

Le procede de detection et/ou d' identification mettant en oeuvre les sequences 
nucleotidiques selon l'invention peut etre de diverse nature. 

On prefere un procede comportant les etapes suivantes : 

a) eventuellement, isolement de l'ADN a partir de Techantillon biologique a analyser, 
25 ou obtention d'un ADNc a partir de l'ARN de Pechantillon biologique ; 

b) amplification specifique de l'ADN de bacteries appartenant a l'espece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe a Paide d'au 
moins une amorce selon l'invention ; 

c) mise en evidence des produits d'amplification. 

30 Ce procede est base sur 1' amplification specifique de l'ADN, en particulier par 

une reaction d'amplification en chaine. 

On prefere egalement un procede comprenant les etapes suivantes : 
a) mise en contact d'une sonde nucleotidique selon l'invention avec un echantillon 
biologique, l'acide nucleique contenu dans Pechantillon biologique ayant, le cas 
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echeant, prealablement ete rendu accessible a 1' hybridation, dans des conditions 
permettant l'hybridation de la sonde a Facide nucleique d'une bacterie appartenant a 
Fespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un micro- 
organisme associe ; 

5 b) mise en evidence de Fhybride eventuellement forme entre la sonde nucleotidique et 
FADN de Fechantillon biologique. 

Un tel procede ne doit pas etre limite a la detection de la presence de FADN 
contenu dans Fechantillon biologique a tester, il peut etre egalement mis en oeuvre pour 
detecter FARN contenu dans ledit echantillon. Ce procede englobe en particulier les 
1 0 Southern et Northern blot. 

Un autre procede prefere selon F invention comprend les etapes suivantes : 

a) mise en contact d'une sonde nucleotidique immobilisee sur un support selon 
Finvention avec un echantillon biologique, Facide nucleique de Fechantillon, ayant, 
le cas echeant, ete prealablement rendu accessible a l'hybridation, dans des 

15 conditions permettant l'hybridation de la sonde a Facide nucleique d'une bacterie 

appartenant a Fespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un 
micro-organisme associe ; 

b) mise en contact de Fhybride forme entre la sonde nucleotidique immobilisee sur un 
support et Facide nucleique contenu dans Fechantillon biologique, le cas echeant 

20 apres elimination de FADN de Fechantillon biologique n'ayant pas hybride avec la 

sonde, avec une sonde nucleotidique marquee selon Finvention ; 

c) mise en evidence du nouvel hybride forme a Fetape b). 

Ce procede est avantageusement utilise avec une puce a ADN selon Finvention, 

Facide nucleique recherche s'hybridant avec une sonde presente a la surface de ladite 
25 puce, et etant detecte par Futilisation d'une sonde marquee. Ce procede est 

avantageusement mis en ceuvre en combinant une etape prealable d' amplification de 

FADN ou de FADN complementaire obtenu eventuellement par transcription inverse, a 

Faide d'amorces selon Finvention. 

Ainsi, la presente invention englobe egalement les kits ou necessaires pour la 
30 detection et/ou F identification de bacteries appartenant a Fespece Streptococcus 

agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe, caracterise en ce 

qu'il comprend les elements suivants : 

a) une sonde nucleotidique selon Finvention ; 
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b) eventuellement, les reactifs necessaires a la mise en oeuvre d'une reaction 
d' hybridation ; 

c) eventuellement, au moins une amorce selon F invention ainsi que les reactifs 
necessaires a une reaction d'amplification de F ADN. 

5 De meme, la presente invention englobe egalement les kits ou necessaires pour 

la detection et/ou 1' identification de bacteries appartenant a Fespece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe, caracterise en ce 
qu'il comprend les elements suivants : 

a) une sonde nucleotidique, dite sonde de capture, selon 1' invention ; 
10 b) une sonde oligonucleotidique, dite sonde de revelation, selon Pinvention ; 

c) eventuellement, au moins une amorce selon F invention ainsi que les reactifs 
necessaires a une reaction d'amplification de FADN. 

Enfin, les kits ou necessaires pour la detection et/ou F identification de bacteries 
appartenant a Fespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un 
1 5 micro-organisme associe, caracterise en ce qu'il comprend les elements suivants : 

a) au moins une amorce selon F invention ; 

b) eventuellement, les reactifs necessaires pour effectuer une reaction d'amplification 
d'ADN ; 

c) eventuellement, un composant permettant de verifier la sequence du fragment 
20 amplifie, plus particulierement une sonde oligonucleotidique selon Finvention, 

sont egalement objet de la presente invention. 

De preference, lesdites amorces et/ou sondes et/ou polypeptides et/ou anticorps 
selon la presente invention utilises dans les precedes et/ou kits ou necessaires selon la 
presente invention sont choisis parmi les amorces et/ou sondes et/ou polypeptides et/ou 
25 anticorps specifiques de Fespece Streptococcus agalactiae CIP 82.45 (ATCC 12403). 
De maniere preferee, ces elements sont choisis parmi les sequences nucleotidiques 
codant pour une proteine secretee, parmi les polypeptides secretes, ou parmi les 
anticorps diriges contre des polypeptides secretes de Streptococcus agalactiae CIP 
82.45 (ATCC 12403). 

30 La presente invention a egalement pour objet les souches de Streptococcus 

agalactiae CIP 82.45 (ATCC 12403) et/ou de micro-organismes associes contenant une 
ou plusieurs mutation(s) dans une sequence nucleotidique selon Finvention, en 
particulier une sequence ORF, ou leurs elements regulateurs (en particulier promoteurs). 
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On prefere, selon la presente invention, les souches de Streptococcus agalactiae 
CIP 82.45 (ATCC 12403) presentant une ou plusieurs mutation(s) dans les sequences 
nucleotidiques codant pour des polypeptides impliques dans la machinerie cellulaire, en 
particulier la secretion, le metabolisme intermediate central, le metabolisme 
5 energetique, les processus de synthese des acides amines, de transcription et de 
traduction, de synthese des polypeptides. 

Lesdites mutations peuvent mener a une inactivation du gene, ou en particulier 
lorsqu'elles sont situees dans les elements regulateurs dudit gene, a une surexpression 
de celui-ci. 

10 L' invention concerne en outre Futilisation d'une sequence nucleotidique selon 

Pinvention, d'un polypeptide selon l'invention, d'un anticorps selon Tinvention, d'une 
cellule selon l'invention, et/ou d'un animal transforme selon l'invention, pour la 
selection de compose organique ou inorganique capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de genes, et/ou de modifier la replication cellulaire 

15 de cellules eucaryotes ou procaryotes ou capables d'induire, d'inhiber ou d'aggraver 
une pathologies liees a une infection par Streptococcus agalactiae ou un de ses micro- 
organismes associes. 

L'invention comprend egalement une methode de selection de composes 
capables de se lier a un polypeptide ou un de ses fragments selon l'invention, capables 

20 de se lier a une sequence nucleotidique selon l'invention, ou capables de reconnaitre un 
anticorps selon l'invention, et/ou capables de moduler, de reguler, d'induire ou d'inhiber 
l'expression de genes, et/ou de modifier la croissance ou la replication cellulaire de 
cellules eucaryotes ou procaryotes, ou capables d'induire, d'inhiber ou d'aggraver chez 
un organisme animal ou humain une pathologie liee a une infection par Streptococcus, 

25 par exemple par Streptococcus agalactiae, ou un de ses micro-organismes associes, 
caracterisee en ce qu'elle comprend les etapes suivantes : 

a) mise en contact dudit compose avec ledit polypeptide, ladite sequence nucleotidique, 
avec une cellule transformee selon l'invention et/ou administration dudit compose a 
un animal transforme selon l'invention ; 
30 b) determination de la capacite dudit compose a se lier avec ledit polypeptide ou ladite 
sequence nucleotidique, ou de moduler, de reguler, d'induire ou d'inhiber 
l'expression de genes, ou de moduler la croissance ou la replication cellulaire, ou 
d'induire, d'inhiber ou d'aggraver chez ledit animal transforme les pathologies liees 
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a une infection par Streptococcus, par exemple Streptococcus agalactiae ou un de ses 
micro-organismes associes. 

Les cellules et/ou les animaux transformes selon T invention, pourront 
avantageusement servir de modele et etre utilises dans des procedes pour etudier, 
5 identifier et/ou selectionner des composes susceptibles d'etre responsables de 
pathologies induites ou aggravees par Streptococcus agalactiae, ou susceptibles de 
prevenir et/ou de traiter ces pathologies. En particulier, les cellules hotes transformees, 
notamment les bacteries de la famille des Streptococcus dont la transformation par un 
vecteur selon Tinvention peut par exemple accroitre ou inhiber son pouvoir infectieux, 
10 ou moduler les pathologies habituellement induites ou aggravees par 1' infection, 
pourront etre utilisees pour infecter des animaux dont on suivra Papparition des 
pathologies. Ces animaux non transformes, infectes par exemple avec des bacteries 
Streptococcus transformees, pourront servir de modele d'etude. De la meme maniere, 
les animaux transformes selon Tinvention pourront etre utilises dans des procedes de 
15 selection de composes susceptibles de prevenir et/ou de traiter les maladies dues a 
Streptococcus. Lesdits procedes utilisant lesdites cellules transformees et/ou animaux 
transformes, font partie de Tinvention. 

Les composes susceptibles d'etre selectionnes peuvent etre des composes 
organiques tels que des polypeptides ou hydrates de carbone ou tous autres composes 
20 organiques ou inorganiques deja connus, ou des composes organiques nouveaux 
elabores a partir de techniques de modelisation moleculaire et obtenus par synthese 
chimique ou biochimique, ces techniques etant connues de l'homme de Tart. 

Lesdits composes selectionnes pourront etre utilises pour moduler la croissance 
et/ou la replication cellulaire de Streptococcus agalactiae ou tout autre micro-organisme 
25 associe et ainsi pour controler Tinfection par ces micro-organismes. Lesdits composes 
selon Tinvention pourront egalement etre utilises pour moduler la croissance et/ou la 
replication cellulaire de toutes cellules eucaryotes ou procaryotes, notamment les 
cellules tumorales et les micro-organismes infectieux, pour lesquelles lesdits composes 
s'avereront actifs, les methodes permettant de determiner lesdites modulations etant 
30 bien connues de Thomme de Tart. 

On entend designer par compose capable de moduler la croissance d'un micro- 
organisme tout compose permettant d'intervenir, de modifier, de limiter et/ou de reduire 
le developpement, la croissance, la vitesse de proliferation et/ou la viabilite dudit micro- 
organisme. 
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Cette modulation peut etre realisee par exemple par un agent capable de se Her a 
une proteine et ainsi d'inhiber ou de potentialiser son activite biologique, ou capable de 
se lier a une proteine membranaire de la surface exterieure d'un micro-organisme et de 
bloquer la penetration dudit micro-organisme dans la cellule hote ou de favoriser 
5 Taction du systeme immunitaire de l'organisme infecte dirige a l'encontre dudit micro- 
organisme. Cette modulation peut etre egalement realisee par un agent capable de se lier 
a une sequence nucleotidique d'un ADN ou ARN d'un micro-organisme et de bloquer 
par exemple I'expression d'un polypeptide dont F activite biologique ou structurelle est 
necessaire a la croissance ou a la reproduction dudit micro-organisme. 

1 0 On entend designer par micro-organisme associe dans la presente invention, tout 

micro-organisme dont I'expression de gene peut etre modulee, regulee, induite ou 
inhibee, ou dont la croissance ou la replication cellulaire peut etre egalement modulee 
par un compose de l'invention. On entend designer egalement par micro-organisme 
associe dans la presente invention, tout micro-organisme comportant des sequences 

15 nucleotidiques ou des polypeptides selon Finvention. Ces micro-organismes peuvent 
dans certains cas comporter des polypeptides ou des sequences nucleotidiques 
identiques ou homologues a celles de l'invention et pourront egalement etre detectes 
et/ou identifies par les precedes ou kit de detection et/ou d' identification selon 
Finvention et egalement servir de cible pour les composes de l'invention. On entend 

20 aussi designer par micro-organisme tout micro-organisme Streptococcus agalactiae de 
tout serotype. 

L'invention concerne les composes susceptibles d'etre selectionnes par une 
methode de selection selon l'invention. 

L'invention concerne egalement une composition pharmaceutique comprenant 
25 un compose choisi parmi les composes suivants : 

a) une sequence nucleotidique selon l'invention ; 

b) un polypeptide selon Finvention ; 

c) un vecteur selon l'invention ; 

d) un anticorps selon Finvention ; et 

30 e) un compose susceptible d'etre selectionne par une methode de selection selon 
Finvention, 

eventuellement en association avec un vehicule pharmaceutiquement acceptable. 
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La presente invention concerne en outre une composition pharmaceutique selon 
l'invention pour la prevention et le traitement cTune infection par une bacterie 
appartenant a l'espece Streptococcus agalactiae. 

La presente invention concerne en outre une composition pharmaceutique selon 
5 l'invention, caracterisee en ce qu'elle comprend des anticorps diriges contre les 
polypeptides specifiques de Streptococcus agalactiae. 

On entend designer par quantite efficace, une quantite suffisante dudit compose 
ou anticorps, ou de polypeptide de l'invention, permettant de moduler la croissance de 
Streptococcus agalactiae ou d'un micro-organisme associe. 
10 L'invention concerne aussi une composition pharmaceutique selon l'invention 

pour la prevention ou le traitement d'une infection par une bacterie appartenant au genre 
Streptococcus ou par un micro-organisme associe. 

L'invention vise en outre une composition immunogene et/ou vaccinale, 
caracterisee en ce qu'elle comprend un ou plusieurs polypeptides selon l'invention et/ou 
15 un ou plusieurs polypeptides hybrides selon l'invention. 

L'invention comprend aussi Putilisation d'une cellule transformee selon 
l'invention, pour la preparation d'une composition vaccinale. 

L'invention vise egalement une composition vaccinale, caracterisee en ce qu'elle 
contient une sequence nucleotidique selon l'invention, un vecteur selon l'invention 
20 et/ou une cellule transformee selon l'invention. 

L'invention concerne en outre une composition immunogene capable d'induire 
une reponse immunitaire cellulaire ou humorale pour la prevention ou le traitement 
d'une infection par une bacterie appartenant a l'espece Streptococcus agalactiae, 
caracterisee en ce qu'elle comprend une composition immunogene ou une composition 
25 vaccinale selon l'invention, en association avec un vehicule pharmaceutiquement 
acceptable et eventuellement un ou plusieurs adjuvants de l'immunite appropries. 

L'invention concerne egalement les compositions vaccinales selon l'invention, 
pour la prevention ou le traitement d'une infection par une bacterie appartenant au genre 
Streptococcus ou par un micro-organisme associe. 
30 De maniere preferee, les compositions immunogenes et/ou vaccinales selon 

l'invention destinees a la prevention et/ou au traitement d'infection par Streptococcus ou 
par un micro-organisme associe seront choisies parmi les compositions immunogenes 
et/ou vaccinales comprenant un polypeptide ou un de ses fragments correspondant a une 
proteine, ou un de ses fragments, de Penveloppe cellulaire de Streptococcus. Les 
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compositions vaccinales comprenant des sequences nucleotidiques comprendront de 
preference egalement des sequences nucleotidiques codant pour un polypeptide ou un 
de ses fragments correspondant a une proteine, ou un de ses fragments, de Penveloppe 
cellulaire de Streptococcus. 
5 Les polypeptides de Tinvention ou leurs fragments entrant dans les compositions 

immunogenes selon l'invention peuvent etre selectionnes par des techniques connues de 
Thomme de Tart comme par exemple sur la capacite desdits polypeptides a stimuler les 
cellules T, qui se traduit par exemple par leur proliferation ou la secretion 
d'interleukines, ou qui aboutit a la production d'anticorps diriges contre lesdits 
1 0 polypeptides. 

Chez la souris, chez laquelle une dose ponderale de la composition vaccinale 
comparable a la dose utilisee chez Thomme est administree, la reaction anticorps est 
testee par prelevement du serum suivi d'une etude de la formation d'un complexe entre 
les anticorps presents dans le serum et Pantigene de la composition vaccinale, selon les 

1 5 techniques usuelles. 

Selon F invention, lesdites compositions vaccinales seront de preference en 
association avec un vehicule pharmaceutiquement acceptable et, le cas echeant, avec un 
ou plusieurs adjuvants de Fimmunite appropries. 

Aujourd'hui, divers types de vaccins sont disponibles pour proteger Fhomme 

20 contre des maladies infectieuses : micro-organismes vivants attenues (M bovis - BCG 
pour la tuberculose), micro-organismes inactives (virus de la grippe), des extraits 
acellulaires (Bordetella pertussis pour la coqueluche), proteines recombinees (antigene 
de surface du virus de Fhepatite B), des polyosides (pneumocoques). Des vaccins 
prepares a partir de peptides de synthese ou de micro-organismes genetiquement 

25 modifies exprimant des antigenes heterologues sont en cours d' experimentation. Plus 
recemment encore, des ADNs plasmidiques recombines portant des genes codant pour 
des antigenes protecteurs ont ete proposes comme strategic vaccinale alternative. Ce 
type de vaccination est realise avec un plasmide particulier derivant d'un plasmide de 
E. coli qui ne se replique pas in vivo et qui code uniquement pour la proteine vaccinante. 

30 Des animaux ont ete immunises en injectant simplement FADN plasmidique nu dans le 
muscle. Cette technique conduit a Fexpression de la proteine vaccinale in situ et a une 
reponse immunitaire de type cellulaire (CTL) et de type humoral (anticorps). Cette 
double induction de la reponse immunitaire est Fun des principaux avantages de la 
technique de vaccination avec de FADN nu. 



WO 02/092818 



39 



PCT/IB02/03059 



Les compositions vaccinales comprenant des sequences nucleotidiques ou des 
vecteurs dans lesquels sont inserees lesdites sequences, sont notamment decrites dans la 
demande internationale N° WO 90/11092 et egalement dans la demande internationale 
N° WO 95/11307. 

5 La sequence nucleotidique constitutive de la composition vaccinale selon 

Tinvention peut etre injectee a Thote apres avoir ete couplee a des composes qui 
favorisent la penetration de ce polynucleotide a Tinterieur de la cellule ou son transport 
jusqu'au noyau cellulaire. Les conjugues resultants peuvent etre encapsules dans des 
microparticules polymeres, comme decrit dans la demande internationale N° WO 

1 0 94/27238 (Medisorb Technologies International). 

Selon un autre mode de realisation de la composition vaccinale selon 
Tinvention, la sequence nucleotidique, de preference un ADN, est complexee avec du 
DEAE-dextran, avec des proteines nucleaires, avec des lipides ou encapsulee dans des 
liposomes ou encore introduite sous la forme d'un gel facilitant sa transfection dans les 

15 cellules. Le polynucleotide ou le vecteur selon Tinvention peut aussi etre en suspension 
dans une solution tampon ou etre associe a des liposomes. 

Avantageusement, un tel vaccin sera prepare conformement a la technique 
decrite par Tacson et al. ou Huygen et al. en 1996 ou encore conformement a la 
technique decrite par Davis et al. dans la demande internationale N° WO 95/1 1307. 

20 Un tel vaccin peut etre egalement prepare sous la forme d'une composition 

contenant un vecteur selon Tinvention, placee sous le controle d'elements de regulation 
permettant son expression chez Thomme ou Tanimal. On pourra par exemple utiliser, en 
tant que vecteur d 5 expression in vivo de Tantigene polypeptidique d'interet, le plasmide 
pcDNA3 ou le plasmide pcDNAl/neo, tous les deux commercialises par Invitrogen (R 

25 & D Systems, Abingdon, Royaume-Uni). Un tel vaccin comprendra avantageusement, 
outre le vecteur recombinant, une solution saline, par exemple une solution de chlorure 
de sodium. 

On entend designer par vehicule pharmaceutiquement acceptable, un compose 
ou une combinaison de composes entrant dans une composition pharmaceutique ou 
30 vaccinale ne provoquant pas de reactions secondaires et qui permet par exemple la 
facilitation de Tadministration du compose actif, Taugmentation de sa duree de vie et/ou 
de son efficacite dans l'organisme, Taugmentation de sa solubilite en solution ou encore 
T amelioration de sa conservation. Ces vehicules pharmaceutiquement acceptables sont 
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bien connus et seront adaptes par rhomme de Tart en fonction de la nature et du mode 
d'administration du compose actif choisi. 

En ce qui concerne les formulations vaccinales, celles-ci peuvent comprendre 
des adjuvants de Timmunite appropries qui sont connus de rhomme de Tart, comme par 
5 exemple Thydroxyde d'aluminium, un representant de la famille des muramyl peptides 
comme un des derives peptidiques du N-acetyl-muramyl, un lysat bacterien, ou encore 
F adjuvant incomplet de Freund. 

De preference, ces composes seront administres par voie systemique, en 
particulier par voie intraveineuse, par voie intramusculaire, intradermique ou sous- 
10 cutanee, ou par voie orale. De maniere plus preferee, la composition vaccinale 
comprenant des polypeptides selon 1' invention, sera administree a plusieurs reprises, de 
maniere etalee dans le temps, par voie intradermique ou sous-cutanee. 

Leurs modes d' administration, posologies et formes galeniques optimaux 
peuvent etre determines selon les criteres generalement pris en compte dans 
15 Petablissement d'un traitement adapte a un patient comme par exemple Page ou le 
poids corporel du patient, la gravite de son etat general, la tolerance au traitement et les 
effets secondaires constates. 

Enfin, Pinvention comprend Putilisation d'une composition selon Pinvention, 
pour le traitement ou la prevention de maladies induites ou aggravees par la presence de 
20 Streptococcus. 

Par ailleurs, la presente invention a egalement pour objet une banque d'ADN 
genomique d'une bacterie du genre Streptococcus, de maniere preferee, Streptococcus 
agalactiae, de maniere preferee la CIP 82.45 (ATCC 12403). 

La banque d'ADN genomique decrite dans la presente invention, en particulier 
25 la banque deposee a la CNCM le 28 decembre 2000 sous le numero d'ordre N° 1-2610, 
recouvre en effet Streptococcus agalactiae CIP 82.45 (ATCC 12403). Toutefois, si 
certaines regions n'ont pas pu etre clonees dans ladite banque, en raison de problemes 
de letalites chez Escherichia coli, ces regions peuvent facilement etre amplifiees et 
identifiees par Phomme du metier, en utilisant des oligonucleotides specifiques des 
30 sequences des extremites des differents clones qui forment les contigs. 

La presente invention concerne egalement les methodes pour Pisolement d'un 
polynucleotide d'interet present chez une souche de Streptococcus agalactiae et absente 
chez une autre souche, qui utilise au moins une banque d'ADN basee par exemple sur 
un plasmide pSYX34 contenant un fragment du genome de Streptococcus agalactiae. 
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La methode selon Pinvention pour Pisolement d'un polynucleotide d'interet peut 
comprendre les etapes suivantes : 

a) isoler au moins un polynucleotide contenu dans un clone de la banque d'ADN 
d'origine de Streptococcus agalactiae, 
5 b) isoler : 

- au moins un polynucleotide genomique ou ADNc d'une bacterie Streptococcus, 
ladite bacterie Streptococcus appartenant a une souche differente de la souche 
utilisee pour la construction de la banque d'ADN de Petape a) ou, de fa?on 
alternative, 

10 - au moins un polynucleotide contenu dans un clone d'une banque d'ADN prepare a 

partir du genome d'une Streptococcus qui est differente de la souche Streptococcus 
agalactiae utilisee pour la construction de la banque d'ADN de Petape a) ; 

c) hybrider le polynucleotide de Petape a) au polynucleotide de Petape b) ; 

d) selectionner les polynucleotides de Petape a) qui n'ont pas forme de complexe 
1 5 d'hybridation avec les polynucleotides de Petape b) ; 

e) caracteriser le polynucleotide selectionne. 

On peut preparer le polynucleotide de Petape a) par la digestion d'au moins un 
clone recombinant avec une enzyme de restriction appropriee, et de fa?on optionnelle, 
P amplification de Pinsert polynucleotide qui en resulte. 
20 Ainsi, la methode de Pinvention permet a Phomme du metier d'effectuer des 

etudes genomiques comparatives entre les differentes souches ou especes du genre 
Streptococcus, par exemple entre les souches pathogeniques et leurs equivalents non 
pathogenes. 

En particulier, il est possible d'etudier et de determiner les regions de 
25 polymorphisme entre lesdites souches. 

L'invention comprend aussi un precede ^identification de sequence specifique 
de Streptococcus agalactiae, caracterise par Talignement de sequences nucleotidiques 
de Streptococcus agalactiae selon l'invention et le traitement de donnees obtenues par 
cet alignement pour isoler les sequences specifiques. 

30 

La presente invention concerne egalement Putilisation des sequences nucleiques 
ou des polypeptides selon la presente invention : 

- pour la secretion de proteines, 

- comme facteurs de virulence, 
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- pour le controle par F intermediate du quorum-sensing, 

- pour F identification de cibles pour les maladies humaines dont Streptococcus 
agalactiae est un modele, et 

- pour F identification de cibles contre les bacteries Gram positives pathogenes 
5 par la methode de genomique soustractive (comme par exemple par comparaison avec 

des bacteries Gram positives non pathogenes). 

EXEMPLES 

Exemple 1 : Materiels et methode 

10 La strategic de sequen?age du genome de Streptococcus agalactiae CIP 82.45 

(ATCC 12403) repose sur un sequen?age alleatoire (shot-gun). La premiere etape de ce 
travail consiste a doner FADN genomique de la bacterie Streptococcus agalactiae dans 
differents vecteurs (plasmides et BAC). 
Materiels et methodes. 

15 1 . Construction des banques : 

a/ Banque de petits fragments dans le vecteur pcDNA2.1 

L'ADN chromosomique de la souche de Streptococcus agalactiae CIP 
82.45 (ATCC 12403) a ete prepare par une methode classique incluant un traitement a 
la proteinase K et une extraction au phenol (9). Environ 10 |ag d'ADN ont ete casses par 

20 nebulisation (1 minute sous une pression de 1 bar) (4). Les extremites des fragments 
d'ADN ont ete rendues franches en faisant agir la DNA-polymerase du bacteriophage 
T4 pendant 15 minutes a 37°C en presence des 4 nucleotides tri-phosphate. L'enzyme a 
ete inactivee par une incubation de 15 mn a 75°C. Des adaptateurs (invitrogen Cat. 
N° 408-18) ont ensuite ete ligatures a ces extremites. Apres ligature, les fragments 

25 d'ADN chromosomiques ayant une taille entre 1 000 et 3 000 paires de bases ont ete 
purifies apres electrophorese sur gel d'agarose. Le vecteur utilise pour la construction de 
la banque, pcDNA2.1 (Invitrogen), a ete digere par l'enzyme BstXl et purifie par 
geneclean (BIO- 101) apres electrophorese sur gel d'agarose. L'ADN chromosomique et 
le vecteur purifie ont ete ligatures par action de la ligase du bacteriophage T4. Le 

30 melange de ligation a ete introduit par transformation dans la souche (^Escherichia coli 
XL2-blue (Stratagene). Environ 4000 colonies sont obtenues par |il du melange de 
ligation. 

b/ Construction d'une banque de fragments de taille moyenne (banque 
deposee a la CNCM sous le numero 1-2610) 
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Afin de limiter la frequence des evenements de co-ligation et de clones 
sans insert, la methode du remplissage partiel du site de coupure a ete utilisee (7). 

L'ADN chromosomique de la souche de Streptococcus agalactiae CIP 
82.45 (ATCC 12403) a ete digere de maniere partielle par l'enzyme de restriction 
5 Sau3A en utilisant une gamme de dilution de l'enzyme. La fraction presentant la gamme 
de tailles souhaitee (entre 2 et 12 kbases) a ete precipitee et les extremites ont ete 
remplies partiellement par le fragment de Klenow de la DNA polymerase d'E. coli en 
presence de dTTP et dCTP. Apres purification sur gel d'agarose les fragments d'ADN 
chromosomique ayant une taille comprise entre 3 et 6 kbases ont ete ligues au vecteur 

1 0 pS YX34 (7) digere par l'enzyme Sail remplie partiellement par l'enzyme de Klenow en 
presence de dATP et dGTP. Le melange de ligation a ete introduit par transformation 
dans la souche d! Escherichia coli XLlO-kan (Stratagene) et etalement sur milieu LB 
contenant du chloramphenicol a une concentration de 20 mg/1. Environ 500 colonies 
sont obtenues par |il du melange de ligation. 

15 2. Preparation des plasmides et sequen£age 

Les plasmides ont ete prepares par une methode semi-automatique de 
preparation developpee au laboratoire GMP base sur la methode de lyse alcaline (2). 
Les inserts chromosomiques ont ete sequences a partir de leurs deux extremites en 
utilisant les primer T7 et universel en suivant les recommandations du fournisseur (PE- 

20 biosystems). Les sequences ont ete determinees en utilisant un sequenceur automatique 
de type 3700 (PE-Biosystem). 

3. Assemblage des sequences 

Les sequences ont ete assemblies en utilisant 1'ensemble de logiciel 
developpe a l'Universite de Washington, Phred, Phrap et Consed (5 5 8). La finition de la 

25 sequence a ete realisee en utilisant 1'ensemble de logiciel GMPTB (7). L'etape de 
finition correspond au resequen9age des regions ou la sequence est peu sure et le 
sequen9age des regions situees entre les contigs. Elle a ete realisee en sequen?ant des 
produits de PCR correspondant a ces regions identifiees par un expert en utilisant les 
logiciels Consed (8) et GMPTB (7). Les sequences des oligonucleotides ont ete definies 

30 en utilisant les logiciels Consed et Primo (8, 10). 

4. Annotation des sequences 

L'identification des phases codantes (CDS) a ete realisee en utilisant 
1'ensemble de logiciel GMPTB (L. Frangeul et al. non publie). Ce programme combine 
les resultats de differentes methodes : (i) identification de phases ouvertes de lecture et 
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leur tri en fonction de leur taille, (ii) Panalyse de la probability d'etre codante en utilisant 
le logiciel Genemark (11), (iii) Identification d'un debut de traduction (codon 
d'initiation et sequence de fixation du ribosome), (iv) similarite de la sequence proteique 
deduite avec les sequences proteiques contenues dans les banques de sequence en 
5 utilisant le logiciel BLASTP. 

Les fonctions des proteines codees par les phases codantes identifiees 
indiquees au tableau 1 ont ete predites par Tanalyse des resultats de recherche de 
similarites dans les banques en utilisant le logiciel BLASTP (1). 

Exemple 2 : Description scientifique de la banque de BAC de Streptococcus agalactiae 
10 CIP 82.45 (ATCC 12403) deposee a la CNCM le 28 decembre 2000 sous le numero I- 
2610. 

Collection de clones $ Escherichia coli DH 10B™ (Calvin et al., J. Bacteriol. 
170, 2796, 1988) contenant des fragments d'ADN genomique de la bacterie 
Streptococcus agalactiae souche NEM 316,CIP 82.45 (ATCC 12403) , clones dans le 

15 vecteur pSYX34 (Xu et al., Biotechniques, 17:57, 1990). Le vecteur a ete digere Sail et 
partiellement rempli a Paide de l'ADN polymerase afin de produire des extremites 
5'-TC. Des fragments genomiques aleatoires de 3-6 kb provenant de Streptococcus 
agalactiae (souche NEM 316, CIP 82-45, ATCC 12403) ont ete digeres partiellement 
par Sau3A et partiellement remplis afin de produire des extremites 5'-GA. Apres 

20 ligature in vitro et transformation, des clones resistant au chloromphenicol ont ete 
selectionnes. Environ 5000 clones ont ete assembles, suspendus dans 15 ml de milieu L 
et congeles. 

Exemple 3 : Les proteines de surface de Streptococcus agalactiae NEM316 

Les proteines de surface des bacteries pathogenes, et plus particulierement les 

25 proteines dites du type LPXTG (Navarre et Schneewind, Microbial. Mol. Biol. Rev. 63 
174-229), jouent un role crucial lors du processus infectieux en permettant notamment 
des interactions entre le microorganisme et les cellules de Thote et/ou Techappement au 
systeme immunitaire. Les inventeurs ont don focalise leur etude sur ce type de proteines 
qui presentent la particularity d'etre liees covalemment au peptidoglycane via le motif 

30 d'ancrage carboxylique LPXTG. Cette reaction est catalysee par une enzyme 
bifonctionnelle (endopeptidase-transpeptidase) appelee sortase. L'etude du role de ces 
proteines dans la virulence de S. agalactiae a ete realisee par 2 approches 
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complementaires (construction d'un mutant sortase-deficient, inactivation des genes 

codant pour des proteines de type LPXTG). 

- Le gene srtA de S. agalactiae NEM316 (IPF N°1268). 

Le mutant MEM 1979, depose le 24 avril 2002 a la CNCM sous le numero I- 
5 2861, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
laquelle 1TPF 1268 a ete inactive. 

L'analyse du genome de NEM316 nous a permis de caracteriser un gene srtA 
presentant homologie respectivement 55 % et 30 % d'identite avec les sortases de 
Streptococcus gordonii et de Staphylococcus aureus. Ce gene a ete inactive par 
1 0 insertion-inactivation et nous avons montre que le mutant ainsi construit n'adherait plus 
a des cellules epitheliales humaines pulmonaires (A549) et uterines (HeLa). Ces 
resultats suggerent que les proteines du type LPXTG de S. agalactiae jouent un role 
dans la virulence de cette bacterie, en permettant notamment son adhesion avec les 
cellules de l'hote. 

15 - Recensement des proteines du type LPXTG de S. agalactiae NEM3 16. 

Une analyse in silico du genome de NEM316 a revele la presence de 30 
proteines de surface putatives possedant le motif d'ancrage de type LPXTG (Tableau 6). 
Nous avons etudie par amplification PCR, en utilisant des amorces speciflques, la 
distribution des genes codant pour 2 1 proteines du type LPXTG dans une collection de 

20 99 souches non-redondantes de S. agalactiae responsables d'infections non-invasives 
(70 souches provenant de portage ou d'infection urinaire) et invasives (29 souches 
provenant d'hemoculture ou de meningite). Cette etude a montre que 6 de ces genes 
(IPN N° 1503, 678, 2192, 1861, 584, 280) etaient presents dans toutes les souches de 
notre echantillonnage (Tableau 7). Deux de ces six genes (IPF N°678 et 1503) ont ete 

25 inactives par insertion-inactivation et les mutants correspondants NEM2056 et 
NEM2057 presentaient une adherence diminuee avec les cellules epitheliales A549 
(Tableau 5). 

Le mutant NEM2056, depose le 24 avril 2002 a la CNCM sous le numero I- 

2862, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
30 laquelle 1TPF 678 a ete inactive. 

Le mutant NEM2057, depose le 24 avril 2002 a la CNCM sous le numero I- 

2863, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
laquelle 1TPF 1503 a ete inactive. 
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- Cibles vaccinates. 

La presence des genes IPF N°1503, 678, 2192, 1861, 584, 280 chez toutes les 
souches de S. agalactiae testees font des proteines correspondantes des cibles vaccinates 
de choix pour le developpement d'un vaccin anti-S. agalactiae. 

5 

TABLEAU 1 : Liste des phases codantes annotees identifiees par Tanalyse des 
sequences des contigs 
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TABLEAU 2 . Proteines de surface de Streptococcus agalactiae 

i 





SEQ ID 


N° IPF 


Motif 

LPXTG 


mf\ f * ~W A * A F 9 A • 1 • * ■ 

% identite/ similitude 


1 


886 


18 


LPHTG 


24/37 : Sec (Surface exclusion proteine) E.faecalis 


2 


386 


1250 


mm mm w j » ^ J — — -— 

LPSTG 


221 AO : Sec 10 (Surface exclusion proteine) 
Enterococcus faecalis plasmid pCFlO 


3 


1669 


280 


LPKTG 


50/65 : pullulanase S. pneumoniae 


4 


1895 


523 


LPATG 


90/91 : alpha like proteine S. agalactiae 


5 


806 


1716 


LPSTG 


31/46 : M-like proteine S. equi 


6 


1183 


2140 


LPLTG 


36/60 : cell-division protein homolog ywcF B. subtilis 
34/56 : stage V sporulation protein E B. halodurans 


7 


1346 


2337 


LPKTG 


25/38 : Unknown B. halodurans 


8 


1942 


571 


LPSTG 


50/60 : Hemagglutinine S. gordonii 


9 


2129 


765 


LPNTG 


28/43 : sdrc S. aureus 


10 , 

I 


2046 


678 


LPKTG 


57/70 : putative cyclo-nucleotide phosphodiesterase 
Strep, dysgalactiae susp. equismilis 


11 ! 


618 i 


1503 


LPKTG 


49/65 : celle envelope proteinase S. thermophilus 


12 


1227 


220 


LPSTG 


30/43 : SspB (adhesion) S. gordonii 


13 i 


1954 : 


584 


LPKTG 


26/48 : hypothetical serine riche repeat prot S. pombe 


14 1 


1493 

Mm ■ 


2495 


LPKTG 


23/ '47 : gene drosophile 

Ml* ^m^ WWW m r^*k ^mmmr ^m\ mm** ^ r m r -m- mm, ^mmr 


15 


1955 


585 


LPKTG 


30/46 : 6-aminohexanoate-cyclic-dimer hydrolase 
Deinococcus radiodurans . 


16 


943 


1861 


LPKTG 


50/62 : hypothetical protein 2 S. mutans 


17 


1221 


2192 


LPKTG 


35/48 : C. elegans UNC-89 (6642 aa) 


18 


613 


15 


LPSTG 


37/52 : SpaA : Ag de surface de S. sobrinus 


19 


382 


1247 


LPSTG 


38/52 : SpaA : Ag de surface de S. sobrinus 


20 


792 


17 


LPKTG 


30 /47 : hypothetical proteine iota de S. pyogenes 
plasmid pDBlOl 


21 


383 


1248 


LPRTG 


38/52 : hypothetical proteine iota de S. pyogenes 
plasmid pDBlOl 


22 


1418 


2414 


LPSTG 


33/47 : orfC E.faecalis, plasmid pAM-beta -1 


Autres proteines possibles (IPXTG, FPXTG) 


23 


2171 


807 


IPQTG 


31/43 : Inconnue B. Halodurans 
29/41 : fimbrial SU Actinomyces naeslundii 
24 :41 : putative cell-surface adhesin SdrF 
[Staphylococcus epidermidis] 


■ — - ■■■ ■: 

24 ; 


1343 


2334 


IPQTG 


27/38 : hypothetical protein 2 L. leichmanii 
23/38 : fimbrial SU Actinomyces naeslundii 


25 


659 


1551 


FPKTG 


37/50 : fibronectin binding protein I S. pyogenes 
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TABLEAU 3: Liste des phases codantes annotees identifies par I'analyse de la sequence genomique complete SEQ ID N°2345 


Fonctions Predites 


similar to glutamyl-aminopeptidase and/or to endo-1 ,4-beta- 
glucanase 


Unknown 


similar to unknown protein 


similar to thioredoxin H1 


weakly similar to phenylalanyl-tRNA synthetase (beta subunit) 


similar to unknown proteins 


similar to single-strand binding protein 


Similar to ABC transporter (ATP-binding protein) 


similar to unknown proteins 


Similar to two-component sensor histidine kinase 


Similar to two-component response regulator 


similar to unknown proteins 


similar to unknown proteins 


Similar to (oligopeptide) ABC transporter (binding protein) 


Similar to oligopeptide ABC transporter (permease) 


similar to phosphatidylglycerophosphate synthase 


Similar to ABC transporter (permease) 


Similar to oligopeptide ABC transporter (ATP-binding protein) 


Similar to oligopeptide ABC transporter (ATP-binding protein) 


Hypothetical protein 


similar to unknown protein 


similar to unknown protein 


similar to transcription-repair coupling factor 


similar to peptidyl-tRNA hydrolase 


similar to unknown proteins 


similar to hypothetical GTP binding protein 


Hypothetical protein 


similar to unknown protein 


similar to putative transcription regulator 


beta subunit of DNA polymerase III 


Positions / Sens 
(p=plus, m=minus) 


202238-203305 m 


203490-203729 m 


203890-204174 p 


204171-204494 p 


204527-205153 p 


205207-205923 m 


206004-206399 p 


2190539-2191378 m 


206522-207166 p 


207193-208938 p 


208919-209659 p 


209829-210284 p 


210286-211014 p 


211257-212885 p 


212998-213975 p 


2191378-2191917 m 


213972-214793 p 


214805-215608 p 


215592-216218 p 


10743-10877 p 


10369-10740 p 


10110-10382 p 


6322-9819 p 


5750-6325 p 
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1953462-1954445 p isimilar to oxidoreductase 


similar to endopeptidase 


similar to unknown proteins 


similar to L.D-carboxypeptidase LdcA 


lysin rich protein 


similar to Na+/H+ antiporter 


similar to alkyl hydroperoxide reductase (large subunit) and 
NADH dehydrogenase 


similar to alkyl hydroperoxide reductase (small subunit) 


similar to unknown proteins 


Unknown 


similar to ornithine transcarbamylase 


Similar to unknown proteins 


Similar to transcriptional regulator 


Similar to unknown proteins 


Similar to glycerol uptake facilitator 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to hypothetical dihydroxyacetone kinase 


Similar to putative transcription regulator 


Similar to putative dihydroxyacetone kinase 


similar to arginine/ornithine antiporter 


Similar to unknown proteins 


Similar to other proteins 


1 754729-1 755562 m similar to (amino acid ?) ABC transporter (binding protein) 


Similar to unknown protein 


Similar to unknown proteins 


similar to ABC transporter (ATP-binding protein) 


similar to ABC transporter (permease) 


similar to carbamate kinase 


similar to NAD alcohol dehydrogenase 


Similar to branched-chain amino acid transporter 


truncated C-terminal part 


Unknown 


truncated C-terminal part 


truncated N-terminal part 
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Unknown 


similar to unknown proteins 


Unknown 


tryptophanyl-tRNA synthetase 


similar to probable type II DNA modification enzyme 


similar to integrase 


similar to unknown proteins 


similar to unknown proteins 


similar to Phospho-beta-D-galactosidase 


Similar to lactose-specific PTS system enzyme IIBC 


Similar to lactose-specific PTS system enzyme IIA 


Similar to transcription antiterminator 


similar to tagatose-1 ,6-di phosphate aldolase 


similar to tagatose 6-phosphate kinase 


similar to galactose-6-phosphate isomerase (large subunit) 


similar to galactose 6-P isomerase (small subunit) 


Unknown 


similar to unknown proteins 


similar to unknown proteins 


similar to unknown protein 


Unknown 


similar to plasmid recombination / mobilization protein 


Unknown 


similar to plasmid replication protein 


Unknown 


similar to replication protein (N-terminal part) 


Unknown 


Unknown 


similar to transcriptional regulator 


similar to integrase 


ribosomal protein S9 


50S ribosomal protein L13 


similar to unknown proteins 


similar to N-acetylglucosamine metabolism protein 


similar to other proteins 


similar to coproporphyrinogen III oxidase (HemN) 
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similar to unknown protein 


Unknown 


similar to unknown protein 


similar to 5-keto-D-gluconate 5-reductase 


similar to sugar-phosphate isomerase 


similar to 2-keto-3-deoxygluconate kinase 


similar to 2-dehydro-3-deoxyphosphogluconate aldolase- 


Unknown 


similar to unknown protein 


similar to transcription regulator (MarR family) 


DNA polymerase III (alpha subunit) 


simi ar to peptidoglycan hydrolase 


prolyl-tRNA synthetase 


similar to other protein 


similar to phosphatidate cytidylyltransferase (CDP-diglyceride 
synthase) 


similar to undecaprenyl pyrophosphate synthetase 


similaer to hypothetical permeases 


similar to 6-phospho-beta-glucosidase 


similar to other proteins 


similar to unknown protein 


similar to transcriptional regulator (AraC/XylS family) 


similar to putative channel transporter 


Unknown 


similar to spermidine/putrescine ABC transporter (binding 
protein) 


similar to spermidine/putrescine ABC transporter (permease) 


similar to spermidine/putrescine ABC transporter (permease) 


similar to spermidine/putrescine ABC transporter (ATP-binding 
protein) 


similar to UDP-N-acetylenolpyruvoylglucosamine reductase 


similar to hydroxymethylpterin pyrophosphokinase 


similar to dihydroneopterin aldolase 


similar to dihydropteroate synthase 


similar to integrase 


similar to GTP cyclohydrolase 
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1965219-1965857 p 


1965883-1966890 p 


1966902-1967540 p j 


1968248-1970101 p 


1970272-1970886 m 


1971019-1971444 m 


1971571-1975977 m 


1976100-1976684 m s 


1976809-1978662 m j 


1978754-1980013 m 


1980044-1980838 m 


1980853-1981605 m 


1218666-1219799 m 


1219890-1221326 m 


1221489-1222103 m 


1222204-1223025 m 


1223650-1224579 p 


1224636-1226168 m 


264314-265096 p 


1226277-1227350 m 


1227343-1228119 m 


1228116-1228910 m 


1228894-1230048 m 


1230097-1230999 m 


1231143-1231631 m 


1231628-1231990 m 


! 1231992-1232795 m 


265093-266226 m 


1232799-1233362 m 
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SA-1 358.1 j 


SA-1 359.1 


SA-1 36.1 


SA-1 361. 3 
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SEQ IDn° 4791 


SEQ ID n° 4792 
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ISEQ ID n° 4799 


SEQ ID n° 4800 


SEQ ID n° 4801 


SEQ ID n° 4802 
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similar to folyl-polyglutamate synthetase 


simi ar to unknown protein 


similar to homoserine kinase 


similar to homoserine dehydrogenase 


Similar to nickel ABC transporter (binding protein) 


Similar to nickel ABC transporter (permease) 


Similar to oligopeptide and nickel ABC transporter (permease) 


similar to unknown proteins 


Similar to oligopeptide ABC transporter (ATP-binding protein) 


Similar to oligopeptide or nickel ABC transporter (ATP-binding 
protein) 


uridylate kinase 


ribosome recycling factor 


similar to unknown proteins 


similar to peptide methionine sulfoxide reductase 


similar to unknown proteins 


similar to myosin-crossreactive streptococcal antigen (unknown 
function) 


similar to phosphate starvation inducible protein, unknown 
function 


Unknown 


2028876-2030531 m 'similar to two-component sensor histidine kinase 


2030524-2031201 m {Similar to two-component response regulator (PhoB) 


Similar to transcriptional regulator PhoU 


similar to phosphate ABC transporter (ATP-binding protein) 


similar to phosphate ABC transporter (permease) 


similar to phosphate ABC transporter (permease) 


similar to phosphate ABC transporter (binding protein) 


similar to single-strand binding protein 


similar to replication protein (plasmid) 


Unknown 


Similar to unknown proteins 


2036742-2037695 m I Similar to ribosomal protein L1 1 methyltransferase 


iSimilar to unknown proteins 


Similar to transcriptional regulators 


1233381-1234643 m 


1234645-1235532 m 


1235519-1236385 m | 


1236387-1237670 m \ 


1647764-1649380 m 


SA-1378.1 | 1646833-1647777 m 


1646027-1646833 m 


266230-266436 m 


1645251-1646039 m 


1644584-1645264 m 


1643735-1644463 m I 


1643162-1643719 m 


1642190-1643044 m 


1641543-1642052 m 


SA-1386.1 I 1641331-1641546 m 


: 1639401-1641173 m 
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2031201-2031857 m 


2031854-2032603 m 


SA-1 395.1 2032596-2033474 m 
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516 i SA-1 391 .2 
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SA-1 399.1 


SA-14.1 


SA-1 40.1 


526 i SA-1 400.1 


527 ! SA-1 401.1 
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! SA-1404.1 


SA-1 405.1 
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Similar to unknown proteins 


Similar to unknown proteins 


Unknown 


Unknown 


Similar to unknown proteins 


similar to xylulose-5-phosphate/fructose-6-phosphate 
phosphoketoiase 


Similar to unknown proteins 


Weakly similar to transcriptional regulator (antiterminator) 


similar to unknown proteins 


1913595-1915112 m similar to L-xylulose kinase 


Unknown ! 


Similar to galactitol-specific PTS enzyme IIC 


similar to glycerate dehydrogenase 


Unknown 


similar to undecaprenol kinase 


similar to competence negative regulator mecA 


weakly similar to DNA translocase 


similar to Streptococcus mutans RgpG protein required for 
biosynthesis of rhamnose-glucose polysaccharide 


157319-158089 p jsimilar to ABC transporter (ATP-binding protein) 


similar to unknown protein 


similar to aminotransferase, putative cysteine desulfurase 


similar to NifU protein 


similar to unknown protein 


similar to serine-type D-Ala-D-Ala carboxypeptidase (penicilin 
binding protein) 


similar to serine-type D-Ala-D-Ala carboxypeptidase (penicilin 
binding protein) 


50S ribosomal protein L31 


similar to metal ABC transporter (binding protein) 


Unknown 


similar to dipeptidase 


609115-610026 p Similar to unknown proteins 


i Similar to unknown proteins 


Similar to unknown proteins 


2039029-2039499 m 


2039471-2039929 m 


2039916-2040059 m 


2674T1 -267725 m 


2040065-2040535 m 


-1907193-1909571 m 


1909661-1910752 m 


1911069-1912748 m 


1912814-1913575 m 


1915178-1916167 m 


1916189-1917640 m 


SA-1424.1 1917738-1918694 m ! 


1918713-1919732 m 


154278-155117 p 


155237-155992 p 


267824-269182 m 


155994-157154 p I 


158126-159388 p 


159390-160622 p 


160609-161052 p 


161152-162570 p 


162642-163829 m 


163982-165217 m 


613213-613473 m 


611580-613100 p 


269145-269570 m 


610041-611438 p 
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SA-1445.2 ; 607257-608147 p 
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ISEQ ID n° 4865 


SEQ ID n° 4866 


SEQ ID n° 4867 


SEQ ID n° 4868 


SEQ ID n° 4870 


SEQ ID n° 4871 


ISEQ ID n° 4872 


SEQ ID n° 4873 


SEQ ID n° 4874 


SEQ ID n° 4875 



WO 02/092818 



360 



PCT/IB02/03059 



CD 
to 

J3 

2 
>> 

CD 

co 
o 

o 



CD 



CO 

c 
jd 
o 

Q_ 
C 

o 



Q_ 

O 

i_ 

jo 
1 

CO 



co 
I 

CO 



CD 
CO 



c 

CO 

< 

t 

>> 

CO 

TO 
Q_ 
CO 
03 



CO 

JD 
O 
CL 

I 
O 



JO 

I 
CO 



CO 
CO 
03 

& 
CO 

03 
i — 

o 

1 

OJ 

a> 

CO 

t: 

CO 
CL 
CO 
03 

O 
-»— » 

jo 

I 

CO 



CD 
CO 
03 
O 

"CD 

< 
Q 



a> 

"O 

<D 

CL 

CD 

"O 
i 

CL 
< 

jo 

i 

CO 



CD 

o 

CD 
I 

CD 

m 
o 

CD 



CD 
LO 

o 

CO 
I 

o 
a> 

o 

CD 



CL 

I s - 
co 
oo 

o 

CO 
I 

CM 

in 

CO 

o 

CD 



CD 

a> 

CD 

CM 
I 

CD 
CO 
CD 
CD 
CO 
CM 



O 
O 

in 

CO 

o 

CO 

o 

CO 
CM 

o 

CO 



CM 
CM 
CM 
O 

co 

I 

t — 
I s - 

CD 
CD 

in 



< 
CO 



CO 
I 

< 

CO 



CD 

< 

CO 



LO 

i 

< 

CO 



o 
in 
M" 

i 

< 
CO 



m 
i 

< 
CO 



in 
co 
m 



co 
co 
in 



I s - 

co 
in 



co 

CO 

in 



CD 
CO 

in 



o 
r- 
m 



I s - 
CM 



CN 

I s - 

CM 



CO 

I s - 

CM 



I s - 

CM 



m 
I s - 

CM 



co 
r- 

CM 



I s - 

CO 



a 
a 

LU 

CO 



co 

OO 



a 

LU 

CO 



CD 

I s - 

CO 

xr 



Q 

O 
LU 

CO 



o 

00 

co 
"3" 



Q 

O 
LU 

CO 



CO 
CO 



O 

LU 
CO 



CM 
CO 
CO 



9 

a 

LU 

CO 



CD 
O 

CO 
I 

Q 

CD 
co 
03 

CD 

CD 

O 

"a 
>* 

CD 
T3 

o 

CD 
CO 



-Q 
t 

CO 

cm" 

I 

o 

CO 
CD 

E 
o 

i_ CD 

JS 

E § 
co 3 



CD 
O 
CD 
CD 
CD 

in 
i 

CM 

oo 
co 

CD 

m 



CM 
CO 

m 
i 

< 

CO 



in 



I s - 

I s - 

CM 



CO 

co 
co 



a 

LU 

co 



co 

CL 

"co 



£ 8 

CO 

to c 

CD O 

c >> 

s a 

CO o 

E ° 

jo o 

_3 "D 

CO * 

E t 

E ro 

£ CL 
03 

05 CO 

o g 

.41 CD 



CO 



CL 

m 
o 
co 

CD 

i 

CO 
CO 

CO 
CD 



CM 

in 

CO 



CO 

I s - 
in 



oo 

I s - 
CM 



co 
co 



a 

LU 



CO 

cz 
jd 
o 

CL 

§ 
o 



jo 

I 

CO 



CO 
CD 

m 
co 

CD 
x — 
I 

CD 

CD 
O 
CO 
CD 



CO 

m 

< 
CO 



in 



CD 
CM 



m 
oo 
co 



a 

LU 



CO CO 



o 

3 



CM 

m 
o 

CM 
i 

M* 
OO 

o 

O 
CM 



CD 
I 

< 

CO 



m 
m 



o 
m 

CM 



co 
oo 

CO 



O 

LU 

CO 



CD 

E 

>* 

N 
C 
CD 

CO 
I- 

o. 



CO 

co 
u. 

o 

TO 

13 
CD 

CD 
i— 

(0 

o 

O 
CO 

c 

CO 



JO 

I 

CO 



m 
m 
o 
co 

CD 
I 

in 
co 
m 

CD 
CM 
CD 



O 
CO 

I 

< 

CO 



CD 

m 



m 

CM 



CO 

co 



a 

LU 

CO 



CD 
CO 
CO 



CO 

co 

o 
o 

CO 

o 



CD 

~o 
CO 

o 



JO 

1 

CO 



CO 

CD 
CM 
CD 
t — 
i 

CM 

r- 

CO 

I s - 

CM 
CD 



CM 
CO 

i 

< 
CO 



I s - 
m 



CM 

in 

CM 



CO 

co 

CO 



O 

LU 
CO 



o 



CD 
00 

r- 

CM 
CD 

I 

co 
in 
m 
r- 

CM 
CD 



co 
co 

i 

< 
CO 



oo 
I s - 
m 



o 

CL 

I 
o 



Z3 

O 

i 

JO 

1 

CO 



r- 

CM 

r- 

CM 
CD 

• 

o 
o 

CO 
CO 
CM 
CD 



m 

CO 
I 

< 

CO 



CD 

I s - 
m 



co 
m 
I s - 

CM 



in 
I s - 

CM 



CD 
CO 
CO 



o 

CD 
CO 



O 
LU 
CO 



a 

LU 

CO 



g 

CD 

E 

N 

CD 
CO 



CD 
> 

3 

CL 



CM 
CO 

co 

CM 
CD 

i 

CO 
CD 
CD 

CM 
CD 



CD 
CD 

i 

< 
CO 



o 

00 

m 



m 
m 
I s - 

CM 



CD 
CO 



O 

LU 

CO 



CO 

CD 

£ 

N 

CD 

CO 
f— 
CL 

O 

"o 

CD 

CL 

CO 
i 

o 



CO 

E 
o 

TO 

E 

CO 



in 
co 

CD 

-^r 

CM 
CD 

i 

I s - 
OO 
CO 

xr 

CM 
CD 



I s - 
CO 

< 
co 



CO 

m 



co 
in 
I s - 

CM 



CM 
CD 
OO 



a 

LU 
CO 



CD 

E 

CD 
CO 



CL 

O 

*CJ 
CD 
CL 
CO 



CO 

E 
o 

JO 

E 

CO 



CM 
CO 
XT 
CM 

CD 

i 

in 
co 

CM 

CD 



0O 
CO 

I 

< 

CO 



CM 
OO 

m 



m 
I s - 

CM 



CO 
CD 

oo 



O 

LU 

CO 



CD 
CO 
CO 



CO 

a> 

CO 

CL 
CO 

o 



CO 
I 

CD 
CO 

.52 

X 
CD 



JO 

1 
CO 



CM 
CM 
O 

CM 
<Ji 

i 

I s - 

m 

CO 

co 

CM 
CD 



CD 
CO 
xT 

I 

< 

CO 



CO 
OO 

m 



CO 

m 
r- 

CM 



CD 
CO 



a 

LU 
CO 



CD 

CO 
CO 

CO 
CO 



CD 

o 

CO 

CD 
> 

CL 



jo 
1 

CO 



CD 

r- 

CM 
CD 

CD 
O 
I s - 
CM 



xr 
i 

< 

CO 



CO 

m 



CD 

m 
I s - 

CM 



m 

CD 

oo 



a 

LU 

CO 



CD 
CO 
CO 

CD 

E 
o 

co 

CD 

+-» 

(0 

CL 

(0 

O 



CO 
I 

CD 
CO 

o 

X 
CD 



JO 

E 

CO 



CO 

in 
co 
co 

CM 
CD 

i 

o 

CD 

CM 
CM 
CD 



O 

r- 

I 

< 

CO 



m 

00 

m 



o 
co 
I s - 

CM 



CO 
CD 

00 



a 

LU 
CO 



CD 

CO 

CO 
I 

CD 

E 

CL 

CD 
i 

CD 

■4— » 

CO 

CL 

CO 

O 

CL 
i 

in 
• 

CD 
CO 
O 

-Q 



JO 

E 
co 



OO 
OO 

CM 
CM 
CD 

I 

CM 

I s - 
I s - 

CM 
CD 



I s - 

< 
co 



CO 
CO 

in 



co 
I s - 

CM 



I s - 

CD 
CO 

xr 



a> 
co 
jo 

o 

CO 

co 

CO 



CO 

o 
"S 



o 

CL 



JO 

E 

CO 



CO 

I s - 

CM 
CD 



CM 

a> 



CM 

I s - 

I 

< 

CO 



I s - 

CO 

m 



CM 
CD 

I s - 

CM 



00 
CD 

oo 



a 

LU 

CO 



a 

LU 
CO 











x 


































E 


















o 


















O 


CD 


CD 














\ 


CO 


CO 














o 


CO 


03 














o 


co 


i 


ase 


dase 






CO 


CO 


sigma 


tyl tran 


CD 








otein 


otein 


cerat 


/pep 1 


irami 






CL 


CL 


CD 

.> 


ace 


hogly 


box; 


E 






1 


1 


"co 

■*—> 


CD 


CO 








O 


O 




.> 


CL 


o 

1 


Q> 








c 


CL 


'■*—» 


CO 


O 










CD 


CO 


O 


Q 


CO 






ZJ 


un 


ind 


ph 


q" 


i 

z 






o 


o 


O 


o 


o 


o 


o 


I 










* 


-♦— » 






1— 


i_ 










o 


o 


JO 


JO 


JO 


CO 


jo 


CO 


JO 


nki 


nki 


E 


E 


imi 


mil 


E 


imi 


imi 


P.. 




CO 


CO 


CO 


CO 


CO 


CO 


CO 


CL 


n 






LJL 


CL 


CL 








m 


CO 


m 


^^^^ 


I s - 


CO 


r — 


CD 


CM 


I s - 




in 


CO 


m 




CD 


CO 




o 




o 






m 


CM 


CO 




m 


co 


I s - 


I s - 


CM 


CO 


CD 


CD 


o 


o 


o 


o 


o 


I s - 


o 


O 


O 












CM 




T — 


T — 


1 


i 


1 


i 


i 


i 


i 


1 


1 


CO 


m 


in 


CO 


m 


CD 


CO 


m 




CO 


m 


CO 


CO 


m 


I s - 


m 




CD 


CM 


I s - 


00 


co 


CM 


m 


CO 


m 


CM 






m 


CO 


h- 




I s - 


CO 


CD 


o 


o 


o 


o 


o 


I s - 


o 


o 


O 












CM 


T — 








in 


r- 


oo 


CD 


CO 


o 




CM 


I s - 


I s - 


I s - 


I s - 


I s - 


CO 


CO 


oo 






xf 


xr 




xf 








1 

< 










SA- 




t — 




i 

< 


i 

< 


i 

< 


• 

< 


1 

< 


• 

< 


1 

< 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CD 


o 




CM 


CO 




m 


CD 


I s - 


00 


CD 


CD 


CD 


CD 


CD 


CD 


CD 


CD 


m 


m 


m 


m 


in 


m 


m 


m 


in 


CO 




in 


CO 


r- 


oo 


CD 


o 




CD 


CD 


CO 


co 


co 


CO 


CO 


I s - 




r- 


I s - 


I s - 


I s - 


I s - 


I s - 


I s - 


I s - 


I s - 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CM 


CD 


O 




CM 


CO 




m 


CO 


I s - 


CD 


O 


O 


O 


o 


o 


o 


O 


o 


oo 


CD 


CD 


CD 




CD 


CD 


CD 


CD 
















-3- 




o 


o 


o 


o 


o 


o 


o 


o 


o 




C 


C 










c 




a 


a 


Q 


Q 


Q 


Q 


Q 


Q 


Q 


a 


a 


a 


O 


O 


O 


a 


a 


o 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


LU 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 


CO 



WO 02/092818 



361 



PCT/IB02/03059 



Similar to transcription repressor of class 1 heat-shock (HrcA) 


Similar to heat shock protein GrpE 


Chaperone protein DnaK 


Chaperone protein DnaJ 


similar to unknown protein j 


1650563-1650988 m jribosomal protein L11 


similar to transmembrane efflux pump protein 


similar to hypothetical N-acyl-L-amino acid amidohydrolase 


similar to transcriptional regulator (LysR family) 


similar to unknown proteins 


similar to para-aminobenzoate synthase, component I 


Similar to DNA translocase 


similar to peptidyl-prolyl cis-trans isomerase 


similar to surface antigen proteins, putative peptidoglycan bound 
protein (LPXTG motif) 


similar to unknown proteins 


similar to metal ABC transporter (permease) 


similar to metal ABC transporter (ATP-binding protein) 


similar to metal ABC transporter (binding protein) 


similar to C5A peptidase, putative peptidoglycan linked protein 
(LPXTG motif) 


similar to two-component response regulator 


simi ar to two-component sensor histidine kinase 


2087111-2087719 p j Unknown 


274084-274575 m | similar to RNA polymerase ECF sigma factor 


leucyl-tRNA synthetase 


similar to unknown proteins 


similar to competence protein ComFC 


competence protein ComFA 


similar to unknown proteins 


similar to cysteine synthetase A 


similar to glycerol dehydrogenase 


similar to hypothetical transaldolase 


similar to transcriptional regulator (TetR/AcrR family) 


similar to formate acetyltransferase 


110012-111046 p 


111049-111621 p 


111802-113631 p 


113920-115059 p 


272173-272880 p 


1651199-1652581 m 


SA-1492.1 1 1652589-1653803 m 


1654062-1654967 p 


1655028-1655381 p 


1655410-1657125 m 


1657207-1659648 m 
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745991-748792 p j 


273140-274087 m 


1660678-1661511 m 
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2080002-2084714 p 
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2085630-2087018 p 


2087806-2090307 m 
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similar to unknown proteins 


similar to branched-chain-amino-acid aminotransferase 


Similar to topoisomerase IV subunit A 


similar to DNA topoisomerase IV (subunit B) 


similar to unknown proteins 


Uracil DNA glycosylase 


similar to unknown proteins 


CMP-N-acetylneuraminic acid synthetase 


Similar to ABC transporter (permease) 


similar to glycosylation or acetylation protein 


similar to UDP-N-acetylglucosamine-2-epimerase | 


similar to N-acetylneuraminic acid synthetase 


capsular polysaccharide repeat unit transporter 


similar to ABC transporter (ATP-binding protein) 


putative ABC transporter (permease) 


similar to unknown transmembrane protein 


similar to acetyltransferase (chloramphenicol ?) 


Unknown 


similar to cation-transporting P-ATPase 


similar to peptide methionine sulfoxide reductase 


similar to unknown proteins 


similar to unknwon proteins 


weakly similar to histidine triad protein, putative lipoprotein 


1.2 Transport/binding proteins and lipoproteins 


Putative peptidoglycan bound protein (FPXTG motif) 


similar to hypothetical sortase protein (N-terminal part) 


similar to putative surface protein (sortase) 


Unknown 


Unknown 


similar to unknown proteins 


Unknown 


Putative cell wall protein, weakly similar to peptidase or esterase 


similar to ABC transporter (ATP-binding protein) 


similar to unknown proteins, putative transmembrane protein 


similar to unknown proteins, putative transmembrane protein 
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Similar to unknown proteins 


Similar to Ribonuclease HII 


similar to unknown proteins 


Similar to signal peptidase 1 


Similar to putative exodeoxyribonuclease V 


Similar to unknown proteins 


Similar to DNA-damage-inducible protein P 


Similar to Pyruvate formate-lyase 


Similar to FMN-binding protein 


1841061-1841990 m ; Similar to unknown proteins 


Similar to C3-degrading proteinase 


Similar to unknown protein 


Similar to glycerol uptake facilitator 


Similar to unknown protein 


Similar to efflux protein j 


similar to ABC transporter (permease) 


similar to ABC transporter (ATP-binding protein) 


similar to ABC transporter (permease) 


similar to other proteins 


similar to unknown proteins 


similar to transposase 


similar to transposase 


similar to transposase 


similar to insertion elemant protein I 


similar to integrase C-terminal part (truncated) 


ribosomal protein L19 


similar to unknown proteins 


similar to other proteins 


similar to N-acetylglucosamine-6-phosphate deacetylase 


similar to flavodoxin 


614783-615805 p similar to adenosine deaminase 


similar to unknown proteins 


30S ribosomal protein S14 


similar to low specificity L-threonine aldolase 


Similar to other proteins (includin putative glycoprotein 
endopeptidase) 


1831820-1832131 m 


SA-1568.3 | 1832242-1833135 p 


278573-278884 m 


1833151-1833744 p 


1833873-1836293 p 


1836407-1836889 p 


1836960-1838054 m | 


1838239-1840551 p 


1840652-1841026 p 


1841987-1842742 m j 


SA-1582.1 j 1842867-1843763 p 


1843842-1844690 m 


1844859-1845311 m 


1845329-1846531 m 


624205-625581 p 


623549-624205 p 


622262-623539 p 


279076-279783 p 


621359-621520 m 


620914-621186 p 


620591-620851 p 


620369-620569 p 


619803-620207 p 


SA-1 596.1 i 618920-619540 m 


618428-618775 p 


616652-617848 p 


616384-616659 p 


280061-281209 p 


615864-616307 p 


613582-614517 m 


1867026-1867295 p 


1867657-1868682 m 


1868802-1869812 m 
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SA-1 598.1 
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Similar to putative acetyitransferase 


Similar to other proteins (includin putative glycoprotein 
endopeptidase) 


Similar to unknown proteins 


similar to hypothetical transcriptional regulator 


1871452-1873131 p Similar to unknown proteins 


Similar to secreted unknown proteins - 


glutamine synthetase 


Similar to transcriptional regulator, MerR/GlnR family 


Similar to unknown protein 


Similar to phosphoglycerate kinase 


Similar to unknown lipoprotein 


similar to other proteins 


Similar to ABC transporter (ATP-binding protein) 


similar to glycerol dehydrogenase 


similar to unknown protein 


similar to other proteins 


similar to cobalamin-independent methionine synthase MetC 


similar to unknown protein 


similar to putative transport protein 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to unknown proteins 


valyl-tRNA synthetase 


Similar to ABC transporter (ATP-binding protein) 


Similar to unknown proteins 


523682-524641 p 'Similar to oxidoreductase 


Similar to putative divalent cation transport protein 


similar to unknown proteins 


Similar to transport proteins 


Similar to unknown proteins 


similar to other proteins 


similar to ABC transporter (ATP-binding protein) 


Similar to hypothetical ABC transporter (permease) 


Similar to unknown proteins 


similar to Na+-transporting ATP synthase 


1869888-1870334 m 


1870297-1870986 m 


"1871168-1871398 p 


1457718-1458158 m 


1873293-1873802 m 


SA-1612.1 1873950-1875296 m 


1875330-1875701 m 


1875781-1876320 m 


1876583-1877779 m 


1877914-1878783 m 


2071 134-2071673 p 


1455854-1457671 m 


2071874-2072959 p 


2073124-2073831 m 


2074178-2076022 m j 


2076067-2078304 m 


2078674-2078997 m 


2078987-2079679 m 


517632-518201 p 


518299-518883 p 


518880-519446 p 


519446-522100 p 


1454110-1455864 m 


522336-523265 m 


524802-525704 p 


525864-526928 p 


1746531-1747739 m 


1745814-1746362 m 


1453376-1454002 m 


1744121-1745797 m 


1743298-1744128 m 


1742592-1743263 p 


1741200-1742579 p 
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SA-1 608.1 
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Similar to glucose-inhibited division protein GidB 


Similar to unknown proteins 


Similar to other proteins 


Similar to unknown proteins 


Similar to two-component response regulator 


1735822-1737327 m Similar to two-component sensor histidine kinase 


Similar to two-component response regulator 


similar to other proteins 


similar to unknown proteins 


similar to unknown proteins 


similar to diacylglycerol kinase 


similar to GTP binding proteins 


Unknown 


Unknown 


Similar to two-component sensor histidine kinase 


1629232-1630824 p Unknown 


similar to transcriptional regulator 


similar to formamidopyrimidine-DNA glycosylase 


similar to dephosphocoenzyme A kinase 


similar to ABC transporter (ATP-binding protein) 


Unknown 


similar to mevalonate kinase 


similar to efflux pump 


Similar to glucan 1 ,6-alpha-glucosidase 


Similar to UDP-galactose 4-epimerase 


similar to two-component response regulator 


similar to two-component sensor histidine kinase 


similar to organic acid transport protein 


similar to malic enzyme ((S)-malate:NAD+ oxidoreductase) 


similar to mevalonate diphosphate decarboxylase 


Similar to transctiptional regulator CtsR 


Similar to endopeptidase CIp ATP-binding chain C 


Similar to acyltransferase 


similar to deoxypurine kinase subunit 


Similar to transcription regulator | 


Similar to other proteins 


1740472-1741185 p 


1739790-1740344 m 


1738879-1739769 m 


1738241-1738774 m 


1737317-1738006 m \ 


1452688-1453374 m 


1636729-1637205 m 


1635601-1636407 m 


1634709-1635206 m 


1634330-1634728 m 


1633389-1634288 m 
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1451459-1452688 m 1 


1628167-1629015 m 


1627197-1628018 m 


1626613-1627200 m 


1625788-1626489 m 


1624152-1625798 m 


1450465-1451343 m 


1622787-1623995 m 


1988716-1990323 m 


1987633-1988628 m 


1986932-1987612 p 


1985404-1986930 p 


1983913-1985250 m 


1982725-1983888 m 


1449539-1450483 m 


1942117-1942581 m 


1939673-1942120 m 


1938962-1939453 p 


1938307-1938948 p 


1937209-1938186 p 


1936350-1937225 p 
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SEQ ID n° 5074 


SEQ ID n° 5075 
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Similar to other proteins 


Similar to unknown proteins 


similar to phosphomevalonate kinase 


cell wall separation 


similar to aminotransferase 


similar to unknown protein 


Similar to unknown proteins 


1726385-1727716 m Similar to UDP-N-acetylmuramate-alanine ligase 


similar to unknown protein, putative peptidoglycan bound protein 
(LPXTG motif) 


similar to Isopentenyl diphosphate isomerase 


Similar to unknown proteins 


Similar to SWI/SNF family helicase 


Similar to GTP binding protein 


Similar to primosome component (helicase loader) Dnal 


Similar to unknown proteins 


Similar to unknown protein 


Unknown 


similar to unknown protein 


similar to other protein 


similar to penicillin-binding protein 2a 


similar to other protein 


putative peptidoglycan linked protein (LPXTG motif) 


similar to ABC transporter (ATP-binding protein) 


Similar to unknown protein, putative ABC transporter 
(permease) 


similar to unknown proteins 


Similar to unknown protein 


Similar to unknown protein 


Unknown 


Similar to 2,3-dihydroxybenzoate-AMP ligase (C-terminal 
Idomain) 


Similar to 2,3-dihydroxybenzoate-AMP ligase (enterobactin 
j synthetase component E) 


Similar to transcription regulator | 


1934954-1936210 p 


1934139-1934957 p 


1448554-1449546 m 


28975-30318 p 


31518-32693 p 


32683-33444 p 


1725796-1726299 m 


i 
i 
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1727726-1728343 m 


1728508-1731606 m 


1731762-1733072 m 
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1734019-1735194 m 


1735194-1735673 m 


1447276-1447494 m j 


2102209-2103849 m 


2101372-2102184 p 


2098935-2101256 m 


2098525-2098698 m 
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1809587-1810966 m 
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1446376-1447230 p 
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Similar to late competence protein required for DNA binding and 
uptake comEB 


Similar to similar to Xaa-Pro dipeptidase 


similar to unknown proteins 


Similar to unknown protein 


1817240-1818739 m similar to multidrug resistance protein 


nucleoside-diphosphate kinase 


hypothetical 


similar to unknown proteins 


similar to unknown proteins 


similar to unknown proteins 


similar to other proteins 


similar to unknown proteins 


Similar to putative acetyl transferase 


Similar to unknown proteins 


2043157-2043462 m Unknown 


Unknown 


Similar to unknown proteins 


Unknown 


weakly similar to integrase 


similar to unknown proteins 


hypothetical gene 


Similar to transcriptional regulator (phage related) 


Similar to unknown proteins 


Similar to unknown proteins 


769589-773128 p [Similar to chromosome segregation SMC protein 


Similar to ribonuclease III 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to two-component sensor histidine kinase 


similar to 3-hydroxy-3-methylglutaryl-coenzyme A reductase 


similar to two-component response regulator 


Similar to unknown proteins 


Similar to chorismate synthase 


! Similar to 3-dehydroquinate synthase 


similar to 3-dehydroquinate dehydratase 


1814891-1815343 m 


1815355-1816422 m 


1445361-1446275 p 


1816522-1817238 m 


959863-960279 p j 


SA-1 734.1 ! 959293-959553 p 


SA-1737.1 ; 957581-958246 p 


957253-957594 p ! 


956387-957256 p 


1444618-1445274 p 


952252-956385 p 


2040862-2041353 p 


2041346-2042614 p I 


2043446-2043847 m 


2043835-2045043 m 


2045045-2045437 m 


2045504-2045959 m 


1444176-1444625 p 


2046386-2046622 m 


2046794-2047288 p 


774016-774840 p 


773219-774016 p 


768895-769581 p 


768351-768719 p 


767539-768348 p 
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SA-1 729.1 
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Similar to unknown proteins 


1508080-1510224 p .Similar to unknown proteins 


1510465-1510824 m |50S ribosomal protein L20 


Similar to'ferredoxin 


similar to 3-hydroxy-3-methylglutaryl-coenzyme A synthase 
(HMG-CoA synthase) 


Similar to unknown protein 


Similar to tripeptidase 


Similar to unknown protein 


Similar to UDP-N-acetylmuramoylatanyl-D-glutamyl-2, 6- 
diaminopimelate ligase 


similar to ferrichrome ABC transporter (ATP-binding protein) 


1519322-1520254 p I similar to ferrichrome ABC transporter (binding protein) 


1520270-1521295 p 'similar to ferrichrome ABC transporter (permease) 


1521292-1522293 p (Similar to ferrichrome ABC transporter (permease) 


Similar to unknown protein 


thymidylate synthase 


Similar to two-component sensor histidine kinase 


Similar to ABC transporter (permease) 


Similar to ABC transporter (ATP-binding protein) 


similar to unknown proteins 


similar to autoinducer-2 production protein (LuxS) 


similar to unknown proteins 


similar to unknown proteins 


1440060-1440554 m 'similar to dihydrofolate reductase 


similar to unknown proteins 


similar to poly(A) polymerase 


Similar to ABC transporter (ATP-binding protein) 


similar to unknown proteins 


Similar to ABC transporter (ATP-binding protein) 


Similar to ABC transporter (ATP-binding protein) 


similar to unknown proteins 


Similar to 4-alpha-glucanotransferase (amylomaltase) 


Similar to glycogen phosphorylase 


similar to plasmid surface exclusion protein, putative 
peptidoglycan bound protein (LPXTG motif) 


1506788-1507945 m 


1513077-1513274 p 


1441627-1442799 p 


1513261-1513752 m 


1513781-1515001 m 


1515137-1516771 m 


1516895-1518349 p 


1518504-1519298 p 


1522323-1522976 m 


1440634-1441473 m 


SA-1 780.2 I 327377-328462 p 


326640-327380 p 


325757-326653 p 


324021-325628 p 


323350-323832 m 


321662-323125 p 


320495-321649 p 


319693-320025 p 


1469012-1470220 m 


1467133-1469001 m 


1466663-1467136 m 


1464857-1466596 m 


1463083-1464852 m 
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similar to exodeoxyribonuclease VII small chain 


similar to exodeoxyribonuclease VII large chain j 


similar to unknown proteins 


similar to bifunctional methylenetetrahydrofolate dehydrogenase 
/ methenyltetrahydrofolate cyclohydrolase (FolD) 


similar to phosphomannomutase 


similar to amino acid ABC transporter (ATP-binding protein) 


Similar to amino acid ABC transporter (permease) 


similar to orotidine 5 -phosphate decarboxylase 


similar to ATP-dependent CIp protease subunit X 


similar to orotate phosphoribosyltransferase 


similar to dihydroorotase 


similar to aspartate transcarbamoylase 


1 128763-1 129839 m 'similar to glutaminase of carbamoyl-phosphate synthase 


similar to carbamoyl-phosphate synthase (glutamine- 
hydrolyzing) 


Unknown 


Unknown 


Similar to glutamate racemase 


Similar to unknown proteins 


similar to hypothetical GTP-binding protein 


Similar to unknown proteins 


Similar to unknown protein 


Similar to integrase 


similar to unknown proteins 


similar to unknown proteins 


Similar to ribosomal large subunit pseudouridine synthase B 
(hypothetical) 


Similar to unknown protein 


similar to transcriptional regulator 


Similar to TRK potassium uptake system protein TrkH 


Similar to TRK potassium uptake system protein TrkA 


similar to aminoglycoside 6-adenylyltranserase 


Unknown 


2060798-2061406 m Unknown 


572506-572721 p 


571188-572528 p 


570226-571062 p 


569375-570229 p 


567542-569236 p j 


566521-567255 p | 


SA-1 808.3 565836-566528 p 


1132887-1133588 m | 


1438616-1439842 m 


1132245-1132874 m 


1130941-1132233 m 


1129853-1130776 m 


i 
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similar to unknown protein 


Unknon, similar to unknown protein 


similar to unknown protein (transmembrane) 


similar to ABC transporter (ATP-binding protein) 


similar to transcription regulator (N-terminal part) 


similar to unknown protein 


similar to unknown protein 


similar to unknown protein 


similar to unknown transmembrane protein 


similar to unknown protein 


CAMP factor 


similar to unknown proteins 


Unknown 


similar to unknown proteins 


Unknown 


similar to unknown proteins 


Similar to fructose-specific PTS enzyme IIABC 


similar to Fructose-1 -phosphate kinase 


similar to transcription repressor of fructose operon FruR 


Unknown 


similar to to Cell Wall Muropeptide Branching Enzyme 


similar to cell wall proteins, putative peptidoglycan linked protein 
(LPXTG motif) 


similar to 2-dehydropantoate 2-reductase 


Similar to transcriptional regulator (Lad family) 


similar to esterase 


Similar to unknown proteins 


Similar to unknown proteins 


manganese-dependent superoxide dismutase 


Similar to transcription antiterminator 


Similar to beta-glucoside-specific PTS enzyme IIABC 


similar to oligopeptide ABC transporter (ATP-binding protein) 


similar to oligopeptide ABC transporter (ATP-binding protein) 


similar to oligopeptide ABC transporter (permease) 


similar to oligopeptide ABC transporter (permease) 


similar to oligopeptide ABC transporter (binding protein) | 


2061393-2061728 m 


2062250-2062738 m 


2062907-2063668 m ! 


2063665-2064567 m ] 


2064772-2065848 m 


2066097-2066711 m 
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similar to amino acid transporter 


ribosomal protein L24 


ribosomal protein L5 


ribosomal protein S"8 


ribosomal protein L6 


ribosomal protein L18 


ribosomal protein S5 


ribosomal protein L30 


ribosomal protein L15 


similar to preprotein translocase SecY 


adenylate kinase 


Unknown 


similar to adenylosuccinate lyase 


similar to unknown proteins 


similar to Holliday junction DNA helicase, subunit B 


similar to homocysteine S-methyltransferase 


similar to protein-tyrosine phosphatase 


974448-974816 m ! similar to transcriptional regulator (GntR family) 


DNA polymerase III (alpha subunit) 


similar to 6-phosphofructokinase 


similar to pyruvate kinase 


similar to type-1 signal peptidase 


Similar to galactose 6-P isomerase (A subunit) 


similar to ATP-dependent CIp proteinase (ATP-binding subunit), 
CIpL 


Similar to galactose 6-P isomerase (B subunit) 


1 994560-1 995492 m : Similar to tagatose-6-phosphate kinase 


Similar to tagatose 1,6-diP aldolase 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to sugar ABC transporter (ATP-binding protein) 


similar to phosphopentomutase 


similar to deoxyribose-phosphate aldolase 


similar to transport system permease protein 


similar to uridine phosphorylase 


similar to transcriptional regulator (GntR family) 


1434490-1435866 m 


82132-82437 p | 


82461-83003 p 


83361-83759 p 


83869-84405 p 


84506-84862 p 


84881-85375 p 


85390-85569 p 


85694-86134 p 


86155-87459 p 


87554-88192 p 


SA-1894.2 I 61615-62718 p 
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Unknown 


chaperonin GroEL 


similar to multidrug resistance protein 


Ribosomal protein L10 


Similar to unknown proteins 


excinuclease ABC (subunit C) 


Transmembrane N-terminal domain, C-terminal domain similar 
to hydrolases 


similar to NADH dehydrogenase 


similar to dipeptidase 


similar to unknown proteins 


similar to unknown proteins 


1429976-1430341 m ribosomal protein L7/L12 


Hpr (ser) kinase/phosphatase 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to oxidoreductase 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to signal recognition particle and to cell division protein 
FtsY 


similar to glycine betaine/carnitine/choline ABC transporter (ATP- 
binding protein) 


similar to choline ABC transporter (permease) 


similar to glycine betaine/carnitine/choline ABC transporter 
(osmoprotectant-binding protein) 


similar to glycine betaine/carnitine/choline ABC transporter 
(permease) 


similar to efflux protein (truncated) 


similar to transcriptional regulator (Rgg like) 


Unknown 


Unknown 


Unknown 


pseudogene 


2108908-2109204 p 


2109304-2110926 m 


1348211-1349551 m 


1430405-1430905 m 


1347385-1348152 p 


1345445-1347226 m 
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Unknown 


Unknown 


similar to ATP-dependent helicase 


similar to unknown proteins 


similar to unknown proteins 


similar to conjugative transposon relaxase 


similar to plasmid protein (replication protein ?) 


similar to lactose repressor 


similar to unknown proteins 


Similar to unknown proteins 


similar to transcriptional regulator 


Unknown 


Similar to UDP-D-glucose:galactosyl glucosyltransferase 


similar to unknown proteins 


similar to methyl transferase (from transposon) 


Alanyl-tRNA synthetase 


similar to unknown proteins 


Similar to unknown proteins 


Similar to DNA mismatch repair protein MutS 


Similar to unknown proteins 


Similar to thioredoxin 


Similar to transcriptional regulators 


3.2 DNA restriction/modification and repair 


Similar to A/G-specific adenine glycosylase 


Similar to unknown protein 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to other proteins 


Similar to transcriptional regulator 


Similar to Cyclopropane fatty acid synthase 


Similar to unknown proteins 
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similar to unknown proteins 


similar to unknown proteins 


Similar to unknown proteins 
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Similar to unknown proteins 


Similar to transport protein 


30S ribosomal protein S18 


Similar to single strand binding protein 


30S ribosomal protein S6 


cell division protein FtsH 


similar to hypoxanthine guanine phosphoribosyltransferase 


similar to other protein 


weakly similar to beta-lactamase 


similar to unknown proteins 


Similar to transcriptional regulator (Lad family) 


similar to maltose ABC transporter (binding protein) 


Similar to maltose/maltodextrin ABC transport system 
(permease) 


similar to maltodextrin ABC transporter (permease) 


similar to di-tripeptide ABC transporter (permease) 


Similar to putative mutator MutT protein 


Unknown 


Unknown 


similar to plasmid replication protein 


2149459-2150064 p similar to unknown proteins 


2148362-2149462 p similar to other proteins 


2148042-2148362 p IUnknown 


Unknown 


similar to unknown proteins 


similar to cadmium-efflux system accessory protein 


putative transport protein 


hypothetical transport protein 


similar to threonine synthase 


similar to alcohol dehydrogenase 


Unknown 


similar to alcohol-acetaldehyde dehydrogenase 


similar to unknown proteins 


Similar to S-adenosylmethionine tRNA ribosyltransferase 


Similar to transcriptional regulator, MarR family 


846249-847313 p \ Similar to unknown proteins 
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1569925-1570953 m 


1571209-1572456 p 


1572554-1573924 p 


1573924-1574760 p 


1574991-1576463 p 


1576508-1576972 m 


1426273-1426506 m 


1577056-1577244 m 


2150270-2150875 p 


2147391-2147840 p 


2145655-2147070 p 


2145266-2145604 p 


2144640-2145254 p 


75018-76298 p 


73423-74913 p 


72286-73302 p 


1425689-1426270 m 


69465-72107 p 


849073-849753 p 


847892-848920 m 


847368-847805 m 


SA-2005.1 : 


SA-2006.1 


SA-2007.1 


CM 

CO 
O 
O 
CM 

< 

CO 


1073 ; SA-2009.2 


SA-2015.2 


SA-2017:2 


SA-2018.2 


SA-2019.3 


SA-202.1 


SA-2022.2 


SA-2024.1 | 


SA-2025.1 


SA-2026.1 


SA-2028.1 


SA-2029.1 


SA-203.1 


SA-2030.2 


SA-2033.2 


1093 ; SA-2034.1 


1094 SA-2035.4 \ 


1095 I SA-2037.4 


SA-2038.1 


SA-2040.1 


SA-2041.2 


SA-2042.2 


SA-2045.2 


SA-2047.1 


SA-2048.1 


SA-205.1 


SA-2050.2 


SA-2051.2 


SA-2052.1 


SA-2053.1 


SA-2054.1 


CD 
CD 
O 


o 
o 


o 


CM 
t- 
O 


CO 

r- 
o 


CD 

r- 
o 


o 

CO 

o 


CO 

o 


CM 
CO 
O 


CO 
CO 

o 


1084 


to 

00 

o 


CD 
00 
O 


r- 

00 

o 


oo 
oo 

o 


o> 

CO 

o 


o 
o 


CM 
O) 
O 


co 

CD 
O 


CD 

o 


CO 
CD 
O 


CD 
CD 
O 


o 
o 


o 




CO 

o 


•t 
o 


son. 


co 
o 


o 


CO 

o 


3214 


3215 j 


|SEQ ID n° 5352 ; 3216 


3217 


3218 


3219 


3220 


3221 


3222 


3223 


3224 


3225 | 


3226 


SEQ ID n° 5363 j 3227 


3228 


3229 


3230 


3231 


3232 


SEQ ID n° 5369 3233 


3234 


3235 


3236 


3237 


3238 


3239 


3240 


3241 


3242 




3243 


3244 


3245 


3246 


3247 


3248 


SEQ ID n° 5350 


LO 

CO 
LO 

o 

o 
a 

UJ 

CO 


SEQ ID n° 5353 


SEQ ID n° 5354 


SEQ ID n° 5355 


SEQ ID n° 5356 


SEQ ID n° 5357 


SEQ ID n° 5358 


SEQ ID n° 5359 


SEQ ID n° 5360 


SEQ ID n° 5361 


SEQ ID n° 5362 


|SEQ ID n° 5364 


SEQ ID n° 5365 


SEQ ID n° 5366 


SEQ ID n° 5367 j 


SEQ ID n° 5368 1 


SEQ ID n° 5370 j 


SEQ ID n° 5371 


SEQ ID n° 5372 


|SEQ ID n° 5373 


SEQ ID n° 5374 


LO 

co 

LO 

o 

Q 

O 
UJ 

CO 


SEQ ID n° 5376 


CO 
LO 

o 

Q 

O 
UJ 

CO 


SEQ ID n° 5378 


SEQ ID n° 5379 


SEQ ID n° 5380 


SEQ ID n° 5381 


SEQ ID n° 5382 


SEQ ID n° 5383 


SEQ ID n° 5384 



WO 02/092818 



375 



PCT/IB02/03059 



Similar to permease (gluconate ?) 


Similar to putative glycerate kinase 


similar to unknown proteins 


Similar to unknown proteins 


Similar to beta-glucosidase 


ribosomal protein S1 7 


ribosomal protein L29 


ribosomal protein L16 


ribosomal protein S3 


ribosomal protein L22 


ribosomal protein S19 


1423303-1425120 m similar to plasmid transfer complex protein TrsK 


ribosomal protein L2 


ribosomal protein L23 


ribosomal protein L4 


ribosomal protein L3 


ribosomal protein S10 


similar to transposase (truncated) 


similar to transposase, N-terminal part 


Unknown 


1423041-1423283 m I Unknown 


streptococcal C5a peptidase 


Similar to sucrose-6-phosphate hydrolase 


Similar to transcriptional regulator (Lad family) 


Similar to transcription termination protein NusB 


Similar to unknown proteins 


Similar to translation elongation factor EF-P 


similar to ABC transporter (ATP-binding protein) 


similar to ABC transporter (binding protein) 


glucose-6-phosphate isomerase 


similar to unknown protein 


466785-467456 p similar to unknown protein 


similar to putative ABC transporter (binding protein) 


Unknown 


similar to unknown protein from conjugative transposon 


similar to UDP-glucose pyrophosphorylase 


844892-846148 p 


843725-844867 p 


1425120-1425608 m 


842464-843558 m 
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81 167-81373 p 


80744-81157 p 


80087-80740 p 


79730-80074 p 
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similar to glycerol-3-phosphate dehydrogenase 


similar to ribonuclease P protein component 


similar to unknown protein and to B. subtilis SpolllJ protein 


Unknown 


Unknown 


similar to hypothetical transcriptional regulator 


Unknown 


Unknown 


similar to unknown protein from conjugative transposons 


Unknown 


Similar to unknown proteins 


Unknown 


Unknown 


Unknown 


Unknown 


Unknown 


Similar to manganese-dependent inorganic pyrophosphatase 


similar to plamsid transfer complex protein TraE 


Similar to pyruvate-formate lyase activating enzyme 


Similar to unknown protein 


Similar to unknown proteins 


Similar to unknown protein 


Similar to unknown protein 


similar to unknown protein 


similar to transposase 


degenerate transposase 


degenerate trnasposase 


Degenerate transposase 


Similar to histidine triad protein 


laminin-binding surface protein 


similar to two-component response regulator VncR 


similar to two-component sensor histidine kinase VncS 


Similar to transposase C-terminal end (truncated) 


Similar to unknown proteins 


similar to plasmid and conjugative transposon protein 


similar to FtsW and RodA proteins 
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similar to unknown protein 


DNA gyrase, subunit B 


similar to two-component response regulator 


ribosomal protein L34 


Similar to unknown proteins 


similar to betaine ABC transporter permease and substrate 
binding protein 


similar to glycine betaine ABC transporter (ATP-binding protein) 


similar to transcription antitermination factor nusG 
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Similar to ATP-dependent RNA helicase, DEAD-box family 
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Similar to peptide-chain-release factor 3 
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2112289-2113185 m I Similar to ABC transporter (permease) 


2113201-2114163 m putative ABC transporter (binding protein) 


21 14628-21 1 5425 m similar to unknown proteins 


similar to unknown proteins 


similar to unknown proteins 


Unknown 


Unknown 


similar to signal recognition particle chain Ffh 


similar to unknown protein 


1068545-1069858 m isimilar to two-component sensor histidine kinase 


Similar to unknown proteins 


Similar to other proteins 


Similar to competence protein ComEA 


similar to competence protein CelB (ComEC) 


Similar to unknown proteins 


Similar to rhamnosyl transferase I 


Similar to putative hexosyltransferase 


Similar to transcription regulator 


similar to plasmid DNA topoisomerase 


similar to putative helicase and methylase 


Similar to fibronectin binding protein, peptidoglycan bound 
protein (LPXTG motif) 


similar to ferrichrome ABC transporter (permease) 


similar to (iron?) ABC transporter (permease) 


similar to sugar O-acetyltransferase 


similar to ribonuclease HII 


similar to unknown protein, hypothetical GTP binding protein 


similar to unknown proteins 


similar to multidrug resistance protein 


853724-854671 p ;similar to hypothetical transcription factor 


1402054-1402353 m [Unknown 


group B oligopeptidase PepB 


similar to hypothetical phosphoglycolate phosphatase 


similar to methyltransferase 


isimilar to protease maturation protein 


2115611-2116471 p 


2116514-2117245 p 


1065700-1066194 m 


1066231-1066419 m ! 


1066541-1068106 m 


1068124-1068456 m 


827664-828428 m 


828563-829303 p 


829403-830056 p 


830049-832277 p 


832403-833212 p 


1540196-1541044 m 


1539067-1540206 m 


1537486-1539015 p 


1045297-1047045 m 


1402425-1408625 m ! 


■ 

1534497-1537202 m 


1095272-1096246 m 


SA-2303.1 1096243-1097205 m 


1097444-1097992 m 


1098013-1098774 m 


1098761-1099612 m 


1099888-1100460 m 


852521-853672 p 


854687-856492 p 


856687-857313 p 


857387-858094 p 


858155-859084 p 


SA-2276.1 


SA-2278.1 


SA-2279.1 


SA-2280.1 


SA-2281.2 


SA-2282.2 | 


SA-2283.1 


SA-2285.1 | 


1301 i SA-2287.1 


SA-2288.2 


SA-2289.2 


SA-2291.1 


SA-2292.1 | 


SA-2294.2 , 


SA-2295.2 


SA-2296.2 


SA-2297.1 


SA-2298.1 


SA-23.1 


1313 , SA-230.1 


SA-2300.3 


SA-2302.2 


SA-2304.1 


SA-2305.1 


SA-2306.1 


SA-2307.2 


SA-2308.2 


SA-2309.1 


SA-231.1 


SA-2311.1 


SA-2312.1 


SA-2313.1 


SA-2314.2 
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3426 l 


3427 


SEQ ID n° 5564 : 3428 j 


3429 


3430 


3431 


3432 


3433 j 


3434 | 


3435 


3436 


3437 ! 


3438 


3439 


3440 


3441 


3442 


3443 


3444 


SEQ ID n° 5583 3447 


ISEQ ID n° 5584 ! 3448 


3449 


3450 


3451 


3452 


3453 


3454 


3455 


SEQ ID n° 5558 


SEQ ID n° 5560 


SEQ ID n° 5561 


SEQ ID n° 5562 


SEQ ID n° 5563 ! 


SEQ ID n° 5565 


SEQ ID n° 5566 


SEQ ID n° 5567 


SEQ ID n° 5568 


SEQ ID n° 5569 


SEQ ID n° 5570 


SEQ ID n° 5571 


SEQ ID n° 5572 


SEQ ID n° 5573 I 
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SEQ ID n° 5576 


SEQ ID n° 5577 


SEQ ID n° 5578 


SEQ ID n° 5579 


SEQ ID n° 5580 


SEQ ID n° 5581 


SEQ ID n° 5582 


ISEQ ID n° 5585 


SEQ ID n° 5586 


SEQ ID n° 5587 


SEQ ID n° 5588 


SEQ ID n° 5589 


SEQ ID n° 5590 


SEQ ID n° 5591 
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i 



similar to anaerobic (class III) ribonucleotide reductase large 
subunit chain 


Unknown 


similar to oxidoreductase 


similar to unknown proteins 


similar to anaerobic ribonucleotide reductase activator 


Unknown ■• 


Similar to glutathione reductase 1 


Similar to unknown protein (secreted protein) 


Similar to iron-sulfur cofactor synthesis protein (NifS like) 


Similar to hypothetical thiamine biosynthesis protein Thil 


similar to capsular polyglutamate biosynthesis 


Unknown 


similar to fructose-bisphosphate aldolase class-ll 


similar to L-2-hydroxyisocaproate dehydrogenase 


SOS ribosomal protein L28 


putative peptidoglycan linked protein (LPXTG motif) 


Similar to sortase protein 


Similar to sortase protein 


Putative peptidoglycan linked protein (LPXTG motif) 


capsular polysaccharide chain length regulator/exporter 1 


similar to unknown proteins 


similar to glucose-1 -phosphate transferase 


beta-1 ,4-galactosyltransferase enhancer 


beta-1 ,4-galactosyltransferase 


capsular polysaccharide repeating-unit polymerase 


similar to glycosyl transferase 


similar to glycosyl transferase 


capsular polysaccharide biosynthesis protein 


similar to DNA repair protein RadC 


similar to unknown protein 


Unknown 


similar to unknown protein 


isimilar to iron-sulfur cofactor synthesis protein or cysteine 
jdesulfurase 


similar to putative rham nosy transferase 


2119955-2122153 m 


2119737-2119880 m 


2118792-2119724 m 


2118292-2118783 m i 


2117602-2118219 m j 


1401744-1402043 m 


1501840-1503189 m 


1501345-1501797 p 


1499953-1501098 m 


1498737-1499951 m 


1497457-1498635 m 


1400941-1401579 m 


143337-144218 p ! 


144303-145220 m 


145459-145647 p 


SA-2334.1 i 1532350-1534374 m 


1531360-1532238 m 


1530476-1531360 m 


1529553-1530479 m 


1289559-1290257 m 


1399815-1400900 m 


1288158-1289546 m 


1287685-1288134 m 


1287212-1287685 m 


1286070-1287215 m 


1285105-1286073 m 


1284124-1285071 m 


1283084-1284040 m 


1217890-1218570 m 


1217239-1217877 p 


1399530-1399760 m 


1216737-1217084 p 


1215620-1216735 p 


1552093-1553247 m 
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SA-233.1 


SA-2330.2 


SA-2331.2 
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SA-2335.2 ! 


SA-2336.1 


SA-2337.2 


SA-2339.2 


SA-234.1 
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SA-2341.1 


SA-2342.1 
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SEQ ID n° 5623 


SEQ ID n° 5624 
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dTDP-L-rhamnose synthase 


similar to unknown protein 


RNA polymerase major sigma factor RpoD 


DNA primase 


similar to DNA-directed RNA polymerase (delta subunit) 


Unknown 


similar to CTP synthetase 


124101-125027 p similar to unknown protein 


1085765-1086643 m {similar to unknown proteins 


Unknown 


similar to unknown protein 


similar to unknown protein 


similar to tRNA pseudouridine 55 synthase 


macrolide-efflux protein 


Unknown 


1723907-1725709 m 'Similar to other proteins 


Similar to transcription elongation factor GreA 


Similar to putative amidase 


similar to ammonium transporter 


Similar to unknown protein 


Similar to unknown protein 


Similar to unknown protein 


Similar to glycerol (sugar)-3-phosphate transporter 


similar to phage repressor-like protein 


similar to hydroxyethyl thiazole kinase (ThiM) 


889777-890574 p Isimilar to phosphomethylpyrimidine kinase (ThiD) 


Similar to putative thiamin biosynthesis protein 


Similar to unknown proteins 


Similar to capsular polysaccharide synthesis protein 


Similar to unknown proteins 


Similar to putative rhamnosyltransferase 


similar to unknown proteins 


similar to 5 -nucleotidase, putative peptidoglycan bound protein 
(LPXTN motif) 


1460536-1460946 m similar to polypeptide deformylase 


1461016-1462365 m isimilar to NADP-specific glutamate dehydrogenase 


1553364-1554218 m 


1554308-1554649 m 


1554758-1555867 m 


1555875-1557683 m 


121540-122115 p 


1399144-1399533 m 


122388-123992 p 


1085068-1085658 m 


1083763-1085034 m 


1083319-1083750 m 


1082343-1083227 m 


1081398-1082330 m 


1398807-1399097 m 


1723352-1723834 m 


1721788-1723248 m 


SA-2373.2 | 1560344-1561387 m 


1561467-1562594 p 


1562631-1563617 m 


1563780-1564085 p 


1564243-1565616 m 


1398261-1398737 m 


890576-891346 p 


889096-889752 p 


888320-889012 p 


1541041-1542465 m 


1542465-1543829 m 


1543831-1544778 m 


1397491-1398261 m 


1458427-1460499 p 
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glycyl-tRNA synthetase (alpha subunit) 


Unknown 


similar to unknown proteins 


similar to transcriptional regulator (Lad family) 


Unknown 


Unknown 


similar to transcriptional regulator (phage related) 


Similar to unknown proteins 


similar to unknown proteins 


Similar to pullulanase, Putative peptidoglycan bound protein 
(LPXTG motif) 


Similar to unknown proteins 


hypothetical protein 


1613541-1614263 m similar to pseudouridylate synthase 


similar to transcriptional regulator 


similar to ribose-phosphate pyrophosphokinase 


similar to putative permease 


Unknown 


similar to unknown plasmid protein 


Unknown 


Similar to unknown proteins 


763222-763533 p 'Unknown 


similar to plasmid proteins 


similar to unknown proteins 


Unknown 


similar to unknown proteins 


chaperonin GroES 


Similar to ABC transporter (ATP-binding protein) 


Similar to ABC transporter (ATP-binding protein) 


716495-717295 m Similar to amino acid ABC transporter (binding protein) 


similar to deoxyuridine 5 -triphosphate nucleotidhydrolase 
(dUTPase) 


similar to tRNA isopentenylpyrophosphate transferase 


translation initiation factor IF-1 


similar to transposase 


similar to transposase, C-terminal part 


282183-283097 p 


1106781-1107011 m 


281328-281870 p | 


1919967-1920950 m 


508125-508481 p 


508546-508968 m j 


508975-509313 m j 


517052-517363 p 


730066-732432 p 


1336040-1339798 m 


516689-516943 p 


509314-510102 p 


236431-236553 p 


30442-31410 p 


1334988-1335905 m 


2154545-2155606 m 


437597-438925 p 


763667-764995 p 


1334770-1334946 p 


759654-760991 p 


SA-2833.1 756757-757404 p 


756452-756757 p 


2208347-2209039 m 


2111022-2111306 m 


2057634-2058251 m 


717307-718062 m 


125222-125668 p 


1333769-1334659 m 


SA-2853.1 ! 88308-88526 p 


1351575-1351865 p 


1363655-1364491 p 


SA-277.1 


SA-2772.1 


SA-278.2 


SA-2787.3 


SA-2789.1 


SA-2790.2 


SA-2791.2 


SA-2799.2 


SA-28.1 


SA-280.2 


SA-2801.2 


SA-2803.2 


SA-2804.2 


SA-2813.1 


SA-2815.2 


SA-282.1 ! 


SA-2822.1 


SA-2823.2 


SA-2829.1 


SA-283.1 


SA-2831.1 


SA-2832.1 


SA-2834.1 


SA-2837.2 


SA-2839.1 


SA-2840.1 


SA-2842.2 


SA-2843.1 


SA-2849.1 


SA-285.1 


SA-2854.2 


SA-2855.1 
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1663 


1666 
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1669 








3711 ! 


3712 : 1670 








1671 






















1672 
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3709 


3710 


3713 j 


3714 


3715 


3716 


3717 


3718 


3719 


3720 


SEQ ID n° 5857 ! 3721 


3722 


3723 


3724 


3725 


3726 


3727 


3728 


3729 


SEQ ID n° 5833 
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LU 
CO 


SEQ ID n° 5835 


SEQ ID n° 5836 l 


SEQ ID n° 5837 


SEQ ID n° 5838 
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CO 


ISEQ ID n° 5840 


SEQ ID n° 5841 


SEQ ID n° 5842 


SEQ ID n° 5843 j 


ISEQ ID n° 5844 


SEQ ID n° 5845 


SEQ ID n° 5846 


SEQ ID n° 5847 ; 


SEQ ID n° 5848 


SEQ ID n° 5849 


SEQ ID n° 5850 


SEQ ID n° 5851 


SEQ ID n° 5852 


SEQ ID n° 5853 


SEQ ID n° 5854 


ISEQ ID n° 5855 


ISEQ ID n° 5856 


SEQ ID n° 5858 


SEQ ID n° 5859 


SEQ ID n° 5860 


SEQ ID n° 5861 
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ISEQ ID n° 5864 


SEQ ID n° 5865 


SEQ ID n° 5866 
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similar to pyrimidine biosynthetic operon repressor 


large conductance mechanosensitive channel protein MscL 


similar to GTP-binding protein 


similar to xanthine phosphoribosyltransferase 


simi ar to hypothetical transcriptional regulator 


similar to unknown proteins 


1251885-1252130 m jsimilarto unknown proteins 


similar to putative plasmid replication protein 


Unknown 


similar to plasmid partition protein ParA 


Unknown 


similar to unknwon proteins 


759383-759640 p ; Unknown 


similar to plasmid protein 


Unknown 


similar to unknown protein 


Unknown 


similar to plasmid protein 


Unknown 


similar to single-strand binding protein 


Similar to unknown proteins 


similar to surface antigen proteins, putative peptidoglycan bound 
protein (LPXTG motif) 


similar to unknown protein, putative peptidoglycan bound protein 
(LPXTG motif) 


Putative peptidoglycan bound protein (LPXTG motif) 


Unknown 


6 No similarity 


similar to ATP-dependent CIp protease ATP-binding subunit 
ClpA 


similar to DNA topoisomerase III 


similar to plasmid proteins 


(Unknown 


similar to unknown proteins 


Unknown 


1055255-1056055 m j similar to unknown proteins 


1493128-1493649 m 


1557873-1558250 p 


1332440-1333678 m 


1169149-1169730 m 


1245656-1245853 p 


1251589-1251837 m : 


SA-2866.1 762834-763217 p 


762543-762821 p 


761728-762546 p 


761005-761589 p 


1331800-1332447 m 


757414-759363 p 


755988-756221 p 


753724-755931 p 


753122-753604 p 


749873-753022 p 


749623-749880 p 


748964-749395 p 


1330829-1331758 m 


1036003-1038804 m 


745217-745939 p 


742879-745140 p 


741782-742864 p 


741424-741771 p 


739413-741332 p 


SA-2888.1 737750-739498 p 


406767-411497 p 


Ql 

LO 

5 
CM 
CO 
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OO 

LO 

LO 
CM 
CO 


1052360-1054726 m 


729554-730012 p 


SA-2856.1 


SA-2857.2 


SA-286.1 


SA-2860. 1 I 


SA-2861.1 


SA-2862. 1 


SA-2863.1 


SA-2867.1 


SA-2868. 1 


SA-2869. 1 


SA-287.1 


SA-2870. 1 


SA-2871.1 


SA-2872.1 ; 


SA-2874. 1 


SA-2875.1 


SA-2877. 1 


SA-2878. 1 


SA-2879. 1 


SA-288.1 


SA-2880. 1 


SA-2882. 1 


SA-2883. 1 


SA-2885. 1 


SA-2886. 1 

1 


SA-2887. 1 


SA-2890.1 


SA-2891. 1 


! SA-2893. 1 


SA-2894. 1 


SA-2895. 1 
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SEQ ID n° 5868 


ISEQ ID n° 5869 \ 
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SEQ ID n° 5871 
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ISEQ ID n° 5877 
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SEQ ID n° 5880 


SEQ ID n° 5881 


SEQ ID n° 5882 


SEQ ID n° 5883 I 


SEQ ID n° 5884 


SEQ ID n° 5885 


SEQ ID n° 5886 


ISEQ ID n° 5887 


SEQ ID n° 5888 


SEQ ID n° 5889 


ISEQ ID n 6 5890 


SEQ ID n° 5891 
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CO 


SEQ ID n° 5893 


SEQ ID n° 5894 


SEQ ID n° 5895 


SEQ ID n° 5896 
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Unknown 


Unknown 


Unknown 


similar to oxidoreductase 


Unknown 


hypothetical start codon 


Unknown 


Unknown 


Unknown 


723919-724089 p j Unknown 


Unknown 


similar to similar to single-strand DNA-specific exonuclease 
RecJ 


Unknown 


similar to unknown proteins 


Unknown 


Unknown 


similar to plasmid replication protein 


Unknown 


Unknown 


hypothetical gene 


Unknown 


similar to putative hydrolytic protein 


similar to unknown proteins 


Similar to amino acid ABC transporter (binding protein) 


ribosomal protein S7 


ribosomal protein S12 


similar to adenine phosphoribosyltransferase 


similar to hypothetical thioredoxin 


similar to unknown proteins 


similar to unknown proteins 


similar to unknown proteins 


ATP-dependent CLP protease proteolytic subunit 


similar to unknown proteins 


similar to unknown proteins 


ribosomal protein S21 


728390-728737 p 


728080-728397 p 


1054780-1055238 m 


"1330066-1330827 m 


727411-727686 p 


726446-727288 p 


725380-726384 p 


724345-725301 m 


724104-724352 p 


723358-723768 p 


1327871-1330069 m 


722916-723365 p 


1062066-1062512 m 


721852-722280 p 


721637-721840 p 


1063411-1064904 m 


719648-719875 p 


719536-719655 p 


719438-719530 p 


SA-2919.1 719103-719432 p 


1325155-1327719 m 


1558627-1559130 m 


1559213-1560019 m 


1882439-1882909 m 


1882931-1883344 m 


1324514-1325032 m 


1982190-1982534 m 


1323716-1324396 m 


1981772-19821 13 m 


1765545-1765901 m 


1701220-1701810 m 


1700875-1701120 m 


; 1322929-1323612 m 


1558347-1558523 m 


SA-2896.1 


SA-2897.1 


SA-29.1 


SA-290.1 


SA-2900.1 I 


SA-2902.1 ! 


SA-2903.1 


SA-2905.1 


SA-2906.1 


SA-2907.1 


SA-2908.1 


SA-291.1 | 


SA-2910.1 


SA-2911.1 


SA-2912.1 


SA-2913.1 


! SA-2914.1 


SA-2916.1 1 


SA-2917.1 


SA-2918.1 


SA-292.1 


SA-2921.3 


SA-2922.1 


SA-2926.1 


SA-2928.1 


SA-293.1 


SA-2939.1 


SA-294.1 


SA-2940.1 


SA-2945.1 


SA-2946.1 


i SA-2947.1 


I SA-295.1 

i 


SA-2951.2 
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1350730-1351386 p j similar to unknown proteins 


similar to unknown proteins 


Similar to unknown proteins 


similar to N-terminal first 100 amino acids of anaerobic 
ribonucleotide reductase 


similar to probable D-amino acid oxidase 


Unknown 


similar to plasmid transfer complex protein 


Unknown 


similar to plasmid proteins 


similar to surface antigen proteins, putative peptidoglycan bound 
protein (LPXTG motif) 


Unknown 


Unknown 


glucose-1 -phosphate thymidyltransferase 


437152-437463 p \ Unknown 


similar to replication initiation protein from Staphylococci plasmid 


Unknown 


similar to plasmid partition protein ParA 


Unknown 


dTDP-4-keto-6-deoxyglucose-3,5-epimerase 


similar to plasmid proteins 


similar to unknown protein 


Unknown 


Unknown 


similar to unknown proteins 


Unknown 


similar to single-strand binding protein 


similar to plasmid transfer complex protein 


similar to membrane nuclease 


419147-419869 p Putative peptidoglycan bound protein (LPXTG motif) 


similar to plasmid surface exclusion protein, putative 
peptidoglycan bound protein (LPXTG motif) 


similar to unknown proteins 


Unknown 


1350071-1350568 m 


1322151-1322939 m 


1136745-1137083 m 


1321039-1322142 m 


433313-433570 p 


431344-433293 p 


427052-427534 p I 


423803-426952 p 


419921-422722 p 


718598-719092 p 


718373-718561 p 


1320126-1320980 m 


436764-437147 p 


SA-2987.2 ! 436473-436751 p 


435658-436476 p 


434935-435519 p 


1319519-1320112 m 


433584-434921 p 


430687-431334 p 


430382-430687 p 


SA-2993.1 i 429918-430151 p 


427654-429861 p 


423553-423810 p 


422894-423325 p 


1025432-1027381 m 


728737-729537 p 


416809-419070 p 


415712-416794 p 


415354-415701 p 


SA-2954.1 


SA-2955.1 


SA-296.1 


SA-2961.1 


SA-297.1 


SA-2973.2 


SA-2974.2 


SA-2975.2 


SA-2976.2 


SA-2977.2 


SA-2978.1 


SA-2979.1 


SA-298.5 


SA-2985.2 


SA-2986.2 


SA-2988.2 


SA-2989.1 


SA-299.5 


SA-2990.1 


SA-2991.1 


SA-2992.1 


SA-2995.1 


SA-2997.1 


SA-2998.1 


SA-3.1 


SA-30.1 


SA-3000.1 


SA-3001.1 


SA-3002.1 


SA-3003.1 
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SEQ ID n° 5939 | 


SEQ ID n° 5940 | 


|SEQ ID n° 5941 


SEQ ID n° 5942 


SEQ ID n° 5943 


SEQ ID n° 5944 


SEQ ID n° 5945 
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SEQ ID n° 5953 ' 


SEQ ID n° 5954 


SEQ ID n° 5955 


SEQ ID n° 5956 


SEQ ID n° 5957 


SEQ ID n° 5958 


SEQ ID n° 5959 


SEQ ID n° 5960 


SEQ ID n° 5961 


SEQ ID n° 5962 


ISEQ ID n° 5963 


SEQ ID n° 5964 


ISEQ ID n° 5965 
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similar to ATP-dependent CIp protease ATP-binding subunit 
ClpA 


similar to plasmid DNA topoisomerase 


similar to plasmid proteins 


Unknown 


similar to dTDP-glucose-4,6-dehydratase 


similar to unknown proteins 


Unknown 


similar to unknown proteins 


Unknown 


402013-402330 p Unknown 


Unknown 


Unknown 


similar to unknown protein 


Unknown 


Unknown 


Unknown 


397291-397701 p 'Unknown 


Unknown 


similar to unknown proteins 


Unknown 
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similar to plasmid replication protein 


Unknown 


Unknown 
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Unknown 


hyaluronate lyase 


similar to other proteins 


similar to unknown proteins 


similar to unknown protein 


truncated, C-terminal part 


similar to unknwon proteins (N-terminal part) 


1312564-1313754 m Isimilar to unknwon proteins 


similar to unknown proteins 
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ribose 5-phosphate isomerase 
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group B streptococcal surface immunogenic protein 


similar to Streptococcus equi zoocin A endopeptidase 


similar to bifunctional 

phosphoribosylaminoimidazolecarboxamide 
formyltransferase/IMP cyclohydrolase 


similar to unknown proteins 


similar to Phosphoribosylglycinamide formyltransferase 


similar to phosphoribosylformylglycinamide cyclo-ligase 


similar to phosphoribosylpyrophosphate amidotransferase 


Unknown 


similar to Phosphoribosylformylglycinamidine synthase 


similar to phosphoribosylaminoimidazolesuccinocarboxamide 
synthase 


similar to ATP-dependent protease CIpE 


Similar to unknown proteins 


similar to unknown proteins 


similar to unknown protein 


isoleucyl-tRNA synthetase 


similar to cell division protein DivlVA 


similar to unknown proteins 


Similar to unknown proteins 


556273-556878 p \ Similar to unknown proteins 


Similar to unknown proteins 


cell division protein FtsZ 


Similar to cell division protein FtsA 


Similar to cell division protein DivlB 


Similar to undecaprenyl-PP-MurNAc-pentapeptide-UDPGIcNAc 
GlcNAc transferase 


Similar to UDP-N-acetylmuramoylalanine-D-glutamate ligase 


Similar to unknown proteins 


similar to putative GTP-binding elongation factor 


similar to unknown proteins 


similar to glucose kinase 


similar to unknown proteins 


47416-48720 p 


46370-47269 p I 


44630-46177 p 
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1057504-1058352 m 
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similar to unknown proteins 


Unknown 


similar to endonuclease III 


similar to other proteins 


Similar to Acetyl-COA acetyltransferase (truncated) 


Unknown 


similar to biotin synthetase 


similar to other proteins 


similar to Anthranilate synthase component II (Glutamine amido- 
transferase) 


similar to ABC transporter (exporter) (ATP-binding protein) 


similar to ABC transporter (exporter) (ATP-binding protein) 


Similar to unknown proteins 


similar to unknown protein 


Unknown 


similar to unknown proteins 


532524-533102 p i similar to unknown proteins 


531 121-532455 p Similar to unknown proteins 


similar to unknown proteins 


similar to phosphopantetheine adenyltransferase 


Unknown 


similar to unknown proteins 


Unknown 


Similar to unknown proteins 


Similar to asparagine synthetase 


similar to metal-dependent transcriptional regulator 


Similar to 5 -methylthioadenosine nucleosidase/S- 
adenosylhomocysteine nucleosidase 


Similar to unknown proteins 


Similar to ADP-ribose pyrophosphatase 


similar to UDP-N-acetylglucosamine pyrophosphorylase 


Similar to unknown proteins 


Similar to unknown proteins 


similar to oxidoreductase 


Unknown 


similar to unknown proteins C-terminal end 
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Unknown 


similar to oxidoreductases 


Similar to unknown proteins 


Similar to unknown proteins 


similar to other proteins 


similar to unknown proteins (C-terminal end) 


Similar to other proteins (N-terminal part) 


Similar to unknown proteins 


Similar to other proteins 


Unknown 


Unknown 


Similar to branched-chain amino acid transporter 


methionyl-tRNA synthetase 


Similar to other proteins 


Similar to unknown proteins 


Similar to PTS enzyme IIC 


Similar to unknown proteins 


Unknown 


Similar to 3 -exo-deoxyribonuclease 


Similar to other proteins 


similar to 06-alkylguanine-DNA-alkyltransferase 


similar to phosphoglycerate dehydrogenase 


similar to unknown proteins 


similar to phosphoserine aminotransferase 


Similar to other proteins 


Unknown 


Similar to unknown proteins 


Similar to unknown proteins 


similar to DNA polymerase III (delta subunit) 


similar to thymidylate kinase 
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simi ar to amino acid ABC transporter (ATP-binding protein) 


similar to ABC transporter (permease) 
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similar to ATP-dependent DNA helicase 


similar to unknown proteins 


similar to uracil permease 


Unknown 


Unknown 


similar to probable amino-acid transporter 


similar to putative cation efflux system protein 


similar to unknown proteins 


similar to unknown proteins 


similar to unknown proteins 


Unknown 


Unknown 


Unknown 


similar to repressor protein - phage associated 


Similar to putative pseudouridine synthase 


Unknown 


Similar to unknown protein 


Similar to unknown protein 


Similar to unknown protein 


Similar to Phosphoribosylpyrophosphate synthetase 


similar to aspartokinase 


similar to unknown protein 


similar to enoyl-CoA isomerase 


Unknown 


Similar to unknown proteins 


similar to alpha protein, putative peptidoglycan linked protein 
(LPXTG motif) 


similar to transcriptional regulator (AraC/XylS family) 


similar to transcriptional regulator tetR-family 


similar to cation efflux system protein 


similar to similar to oxydoreductases, N-terminal part 


similar to oxydoreductase (C-terminal part) 


Unknown 


similar to alcohol dehydrogenase (N-terminal part) 


similar to alcohol dehydrogenase (C-terminal part) 


similar to transcriptional regulator (MerR family) 
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Similar to streptococcal hemagglutinin from Streptococcus 
gordonii, Putative peptidoglycan bound protein (LPXTG motif) 


Similar to transcription regulator RofA related 


excinuclease ABC chain B 


Similar to unknown proteins 


glutamine ABC transporter permease and substrate binding 
protein 


glutamine ABC transporter ATP-binding protein 


1607145-1607495 p lUnknown 


Similar to unknown proteins 


Similar to GTP-binding protein 


Similar to aminopeptidase 


Putative peptidoglycan bound serine rich protein (LPXTG motif) 


similar to amidase or hydrolase, putative peptidoglycan bound 
protein (LPXTG motif) 


Similar to fructokinase 


Similar to mannose-6-phosphate isomerase 


Similar to preprotein translocase SecA subunit 


similar to 2-dehydro-3-deoxyphosphoheptonate aldolase 


similar to holo-acyl-carrier protein synthase 


similar to alanine racemase 


1789964-1791502 m Similar to immunogenic secreted protein 


Similar to ATP-dependent DNA helicase RecG 


Similar to oxidoreductase 


Unknown 


hypothetical gene 


Similar to shikimate 5-dehydrogenase 


Similar to L-asparaginase 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to putative aminotransferase 


Similar to transcriptional regulator (CodY family) 


Similar to other proteins 


Similar to 3-hydroxyacyl-CoA dehydrogenase 


Similar to unknown proteins 


1595010-1598942 m 


1599325-1600821 p I 


1600918-1602909 m 


1602970-1603890 m 


1604073-1606256 p 


1606256-1606996 p 


1607587-1607745 m 


1607771-1609084 m j 


1609451-1610692 p 


1610726-1611304 m 


1611414-1613456 m 


1797911-1798792 m 


1796846-1797793 m 


SA-591.1 i 1794209-1796737 m 


1793076-1794083 m 


1792692-1793051 m 


1791595-1792695 m 


1787869-1789884 m 


1786664-1787578 m 


1028574-1028807 m 


2156179-2156709 m 


1785688-1786566 m 


1784691-1785653 p 


1783240-1784622 m 


1782732-1783184 p 


1781253-1782464 m 


1780342-1781127 m 


1779727-1780275 m 


1778715-1779680 p 


1777897-1778526 m 
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SA-573.1 
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Similar to unknown proteins 


Similar to Pyruvate Phosphate Dikinase 


Similar to Glu-tRNA Gin amidotransferase subunit C 


Similar to Glutamyl-tRNA Gin amidotransferase subunit A 


Similar to Glu-tRNA amidotransferase subunit B 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to unknown proteins 


similar to integrase, C-terminal part 


Similar to probable nicotinate-nucleotide adenylyltransferase 


1766488-1767075 m I Similar to unknown proteins 


similar to unknown proteins 


Similar to unknown proteins 


Similar to transporter (antiporter) 


Similar to UDP-N-acetylmuramoylalanyl-D-glutamyl-2,6- 
diaminopimelate-D-alanyl-D-alanyl ligase 


Similar to D-alanine-D-alanine ligase 


Similar to recombination protein RecR 


Similar to penicillin binding protein 2B 


Similar to phosphoglycerate mutase 


Unknown 


Similar to triosephosphate isomerase 


elongation factor Tu 


Similar to cell division protein FtsW and to RodA protein 


Similar to phosphoenolpyruvate carboxylase 


Similar to oligopeptidase 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to two-component response regulator 


Similar to bacteriophage endolysin 


Similar to other proteins 


Similar to transcriptional regulator 


797856-798497 m Similar to putative phosphoglycerate mutase 


Similar to unknown proteins 


lysyl-tRNA synthetase 


1777056-1777886 m 


1774398-1777043 m 


1773958-1774260 m 


1772492-1773958 m 


1771050-1772492 m 


1770006-1770920 m \ 


1769362-1769922 m 


1768244-1769362 m 


1767834-1768151 m 


2156559-2157413 p 


1767072-1767704 m 


1765903-1766424 m j 


818453-819139 p 


817104-818324 p 


815550-816917 p 


814357-815403 p 


813620-814216 p 


811563-813605 p 


810739-811431 p 


2157770-2158441 p 1 


809804-810562 p 


SA-633.1 808427-809623 p 


806807-808075 p 
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Similar to GTP pyrophosphokinase (stringent response protein 
RelA) 


Similar to unknown proteins 


Similar to adhesion proteins 


similar to pneumococcal histidine triad protein B precursor (N- 
terminal part) 


similar to pneumococcal histidine triad protein B precursor (C- 
terminal part) 


Similar to transcriptional regulator, DeoR family 


similar to two-component response regulator 


similar to ornithine carbamoyltransferase 


theronyl-tRNA synthetase 


similar to glucosyl transferase 


similar to hexosyltransferase 


similar to alpha-amylase 


catabolite control protein A 


similar to X-Pro dipeptidase 


similar to beta-N-acetylglucosaminidase 


Unknown 


similar to oxidoreductase 


Similar to hypothetical two-component sensor histidine kinase 


similar to D-mannonate hydrolase 


similar to glucuronate isomerase 


similar to 2-dehydro-3-deoxyphosphogluconate aldolase 


similar to transcriptional regulator (GntR family) 


similar to beta-glucuronidase 


similar to 2-keto-3-deoxygluconate kinase 


similar to transporter 


similar to D-lactate dehydrogenase 


Similar to hypothetical two-component response regulator 


similar to PTS enzyme IIBC 


similar to transcriptional regulator, LysR family 


Unknown 


putative transmembrane protein 


similar to ABC transporter (ATP-binding protein) 
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similar to unknown proteins 


similar to 5-enolpyruvylshikimate-3-phosphate synthase 


similar to shikimate kinase 


Similar to membrane bound transcriptional regulator 


similar to putative RNA methyltransferase 


hypothetical CDS 


similar to diadenosine tetraphosphatase, acid phosphatase 


similar to unknown proteins 


similar to putative transcriptional regulator (TetR/AcrR family) C- 
terminal part 


similar to putative transcriptional regulator (TetR/AcrR family) N- 
terminal part 


similar to C protein alpha-antigen from Streptococcus 
agalactiae] N-terminal part 


similar to transposase, truncated. 


similar to unknown proteins 


similar to transcriptional regulator (TetR/AcrR family) 


similar to transposase N-terminal part 


similar to unknown protein 


similar to chaperonin (heat shock protein 33 homolog) 


similar to transcriptional regulator (C-terminal part) 


similar to transcriptional regulator (N-terminal part) 


Putative peptidoglycan bound protein (LPXTG motif) 


Putative peptidoglycan bound protein (LPXTG motif) 


similar to sortase protein 


similar to sortase protein 


similar to unknown proteins 


50S Ribosomal protein L33 


50S ribosomal protein L32 


histidyl-tRNA synthetase 


aspartyl-tRNA synthetase 


similar to unknown proteins 


30S ribosomal protein S4 


similar to unknown proteins 


similar to unknown proteins 


arginyl-tRNA synthetase 


638356-639420 m 


639649-640932 p 


640925-641437 p 


641494-642867 p 


642968-644323 p 


644431-644652 p 


644770-645507 p 


645828-646346 p 


646475-64671 1 m 


646692-647000 m 


647183-647515 p | 


647636-648562 m | 


1028864-1031071 m 


2175288-2175827 p 


648505-648780 m 


648913-649050 p 


649438-649785 m 


649979-650398 m 


650399-651187 m 


651570-653234 p 


653323-654246 p 


654248-655165 p 


655122-655973 p 


2175913-2176209 m 


2144199-2144348 p 


2144001-2144183 p 


2142501-2143781 m 


2140657-2142408 m 


2139723-2140667 m 


2176453-2177064 m 


2138743-2139615 m 


2138408-2138716 p 


2136629-2138320 p 


SA-787.1 


CO 
CO 

1 

< 

CO 


SA-789.1 


SA-790.1 
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SA-793.1 ! 
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SA-797.1 


SA-798.1 


SA-799.1 


SA-8.1 


SA-80.1 


SA-800.1 


SA-801.1 


SA-803.1 


SA-804.1 


SA-805.1 


SA-806.1 


SA-807.1 


SA-808.1 


SA-809.3 


SA-81.1 


SA-81 1 .2 


SA-812.1 


SA-814.1 


SA-817.2 


SA-819.2 


SA-82.1 


SA-820.1 


SA-821.1 


SA-822.1 


2150 


4292 i 2151 


2152 


2154 
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2161 


2162 


2163 


2164 | 
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2166 


2167 
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4305 
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4308 


4309 


4310 


4311 


4312 


SEQ ID n° 6449 , 4313 


4314 


4315 


4316 


4317 


4318 


4319 


4320 


4321 


4322 


4323 


|SEQ ID n° 6428 I 


SEQ ID n° 6429 \ 


SEQ ID n° 6430 


SEQ ID n° 6431 


| SEQ ID n° 6432 


SEQ ID n° 6433 


SEQ ID n° 6434 j 


SEQ ID n° 6435 


SEQ ID n° 6436 | 


SEQ ID n° 6437 


SEQ ID n° 6438 


ISEQ ID n° 6439 


SEQ ID n° 6440 


SEQ ID n° 6441 j 


SEQ ID n° 6442 j 


SEQ ID n° 6443 


SEQ ID n° 6444 


|SEQ ID n 6 6445 


SEQ ID n° 6446 


SEQ ID n° 6447 


SEQ ID n° 6448 


SEQ ID n° 6450 


SEQ ID n° 6451 


SEQ ID n 6 6452 


SEQ ID n° 6453 


SEQ ID n° 6454 


SEQ ID n° 6455 


SEQ ID n° 6456 


SEQ ID n° 6457 


SEQ ID n° 6458 


SEQ ID n° 6459 
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similar to unknown protein 


similar to transposase 


tyrosyl-tRNA synthetase 


similar to penicillin-binding protein 1b 


RNA polymerase beta-subunit 


Similar to GidA protein 


RNA polymerase beta -subunit 


similar to unknown proteins 


similar to transporter (competence protein) 


probably part of the DNA transport machinery, ComGB protein 


similar to exogenous DNA-binding protein comGC 


similar to hypothetical competence proteins 


similar to unknown proteins 


similar to hypothetical competence proteins 


similar to unknown proteins 


similar to unknown proteins 


acetate kinase 


similar to transcriptional regulator 


similar to unknown proteins 


Unknown 


similar to dihydroorotate dehydrogenase A 


similar to unknown proteins 


similar to Cell Wall Muropeptide Branching Enzyme 


similar to cell wall muropeptide branching enzyme 


similar to cell wall muropeptide branching enzyme 


similar to unknown proteins 


similar to unknown proteins 


similar to unknown proteins 


Similar to cation-transporting P-ATPase j 


similar to unknown proteins 


similar to fructose-1 ,6-bisphosphatase 


Similar to other proteins 


Unknown 


similar to tRNA (5-methylaminomethyl-2-thiouridylate)- 
methyltransferase 
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Similar to peptide chain release factor RF-2 


Similar to cell division ATP-binding protein FtsE 


596287-597216 p >Similar to cell-division protein FtsX 


597269-597979 m jSimilar to unknown proteins 


similar to unknown proteins 


H+-transporting ATP synthase c chain 


H+-transporting ATP synthase a chain 


H+-transporting ATP synthase b chain 


similar to L-serine dehydratase beta subunit 


H+-transporting ATP synthase delta chain 


H+-transporting ATP synthase alpha chain 


H+-transporting ATP synthase gamma chain 


H+-transporting ATP synthase beta chain 


H+-transporting ATP synthase epsilon chain 


UDP-N-acetylglucosamine 1 -carboxyvinyltransferase 


similar to competence associated membrane nuclease 


Phenylalanyl-tRNA synthetase alpha chain 


similar to other proteins 


Phenylalanyl-tRNA synthetase beta chain 


similar to unknown proteins (C-terminal part) 


similar to ATP-dependent exonuclease, subunit B 


similar to ATP-dependent exonuclease, subunit A 


similar to cation transporter 


similar to putative tRNA modification GTPase TrmE 


Isimilar to L-serine dehydratase alpha subunit 


iSimilar to ribonucleotide diphosphate reductase small subunit 


Similar to ribonucleotide reductase large subunit 


Similar to glutaredoxin 


Similar to histidine-containing phosphocarrier protein of the 
phosphotransferase system (PTS) 


phosphoenolpyruvate:sugar phosphotransferase system enzyme 


similar to glyceraldehyde-3-phosphate dehydrogenase 


similar to oligosaccharide deacetylase 


2187369-2188046 m similar to other proteins 
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similar to RNA helicase 


similar to uridine kinase 


similar to unknown proteins 


878275-879939 p [similar to DNA polymerase III gamma/tau subunit 


similar to unknown proteins 


similar to transcriptional repressor of the biotin operon 


S-adenosylmethionine synthetase 


similar to fibronectin-binding protein 


Unknown 


hypothetical protein 


similar to unknown proteins 


similar to unknown proteins 


similar to cation ABC transporter (ATP-binding protein) 


Unknown 


Similar to unknown protein 


Similar to DNA-methyltransferase 


Similar to plasmid relaxase and mobilisation protein A 


similar to unknown proteins 


Unknown 


similar to aggregation promoting protein (adhesin involved in 
high frequency of conjugation) 


hypothetical CDS 


Unknown 


similar to plasmid unknown proteins 


Unknown 


Similar to transfer complex protein TrsK - Lactococcus lactis 
plasmid pMRCOl 


Unknown 


Similar to gram positive plasmid protein 


Unknown 


Unknown 


similar to plasmid unknown proteins 


Unknown 


Similar to plasmid transfer complex protein TrsE 


similar to two-component sensor histidine kinase 


Similar to D-alanine-D-alanyl carrier protein ligase 


875835-876917 m 


877062-877691 p 


877778-878275 p 


880028-880222 p 


880203-881138 m 


881323-882519 p 


883038-884945 p 


885012-885557 p 


885717-885845 p 


885953-886519 p 


886516-887070 p | 


887074-888360 p 


1170326-1171621 m 


1171761-1172060 m | 


1172071-1173318 m | 


1173315-1174946 m 


1174918-1175292 m 


11 75295-1 175858 m 


2188179-2188718 m 


1175861-1176157 m 


1176201-1176500 m 


11 76552-1 179788 m 


1179790-1180155 m 


1180197-1182242 m 


1182242-1182733 m 


1182755-1183537 m 


1183537-1183809 m 


1183829-1184434 m 


1184455-1187145 m 


1187178-1187708 p 


1187902-1190292 m 


1899710-1900897 m 


1898029-1899564 m 


SA-941. 1 


SA-942. 1 


SA-943. 1 


SA-944. 1 | 


SA-945.1 


SA-946. 1 


SA-947. 1 


SA-948. 1 


SA-949. 1 


SA-950.1 I 


SA-951. 1 


SA-952. 1 


SA-953.2 


SA-954. 1 


SA-955.1 


SA-956. 1 


SA-957. 1 


SA-958. 1 


SA-959. 1 


SA-96. 1 


SA-960. 1 


SA-96 1.1 


SA-964. 1 


SA-966. 1 


SA-967. 1 


SA-968. 1 


SA-969. 1 


SA-970. 1 


SA-971.1 


SA-973. 1 


SA-974. 1 


SA-975.2 


SA-976.2 


SA-977.1 


2289 


2290 | 


2291 


2292 


4430 i 2293 


2294 


LO 

o> 

CM 
CM 


2296 , 


2297 | 


2298 


2299 


2300 


2301 | 


2302 


2303 


2304 


2305 


2306 


2307 


2308 


2309 


2310 


2311 


2312 


2313 


2314 


2315 


2316 


2317 


2318 


2319 


2320 


2321 


CM 
CM 
CO 
CM 


4426 


4427 


4428 


4429 [ 


4431 


4432 


4433 


4434 


4435 ; 


4436 


4437 


4438 


4439 


4440 


4441 


4442 


4443 


4444 


i 

4445 1 


SEQ ID n° 6582 j 4446 


4447 


4448 


4449 


4450 


4451 


4452 


4453 


4454 


4455 


4456 


4457 


4458 


4459 


SEQ ID n° 6562 


SEQ ID n° 6563 I 


SEQ ID n 6 6564 


SEQ ID n° 6565 


SEQ ID n° 6566 


SEQ ID n° 6567 | 


SEQ ID n° 6568 


SEQ ID n° 6569 


SEQ ID n° 6570 


SEQ ID n° 6571 


SEQ ID n° 6572 


SEQ ID n° 6573 


SEQ ID n° 6574 | 


SEQ ID n° 6575 


SEQ ID n° 6576 


SEQ ID n° 6577 


SEQ ID n° 6578 ! 


SEQ ID n° 6579 


SEQ ID n° 6580 


SEQ ID n° 6581 


SEQ ID n° 6583 


SEQ ID n° 6584 


SEQ ID n° 6585 


SEQ ID n° 6586 


SEQ ID n° 6587 


SEQ ID n° 6588 


o> 

OO 
LO 
CO 

o 

Q 

a 

UJ 

CO 


SEQ ID n° 6590 


SEQ ID n° 6591 


ISEQ ID n° 6592 


|SEQ ID n° 6593 


ISEQ ID n° 6594 


SEQ ID n° 6595 
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similar to LTA D-alanylation protein DItB 


putative ABC transporter (permease) ! 


Similar to D-alanyl carrier protein 


similar to LTA D-alanine transfer protein DltD 


Unknown 


Unknown 


Unknown 


Unknown 


similar to unknown proteins 


similar to unknown proteins 


histidine triad family protein 


Similar to 16 rRNA (adenine-N6,N6-)-dimethyltransferase 


1.2 Transport/binding proteins and lipoproteins 


Similar to 23S ribosomal RNA methyltransferase 


1887973-1888845 m .similar to unknown proteins 


similar to ribulose-5-phosphate 3-epimerase 


Similar to unknown proteins 


Similar to unknown proteins 


similar to unknown proteins 


similar to transcription repressor of purine operon PurR 


qimilar to unknown proteins 


similar to pyrroline-5-carboxylate reductase 


1896767-1898032 m 


2188934-2189728 m 


1896513-1896752 m 


1895258-1896520 m 


1894691-1895083 m 


1893399-1894691 m 


1893016-1893408 m 


1892725-1893006 m 


1891761-1892543 m 


1891208-1891774 m 


1890755-1891204 m 


1889856-1890728 m 


2189721-2190563 m 


1889001-1889852 m 


1887304-1887966 m 


1886679-1887311 m 


1885403-1886677 m 


1884472-1885413 m 


1883563-1884375 m 


200712-201377 p 


201398-202168 m 


SA-978.1 


SA-98.1 


SA-980.1 


SA-981.1 


SA-982.1 


SA-983.1 


SA-984.1 


SA-985.1 


SA-986.4 


SA-987.4 


SA-988.4 | 


SA-989.1 


SA-99.1 


SA-990. 1 


SA-991.1 


SA-993. 1 


SA-994. 1 


SA-995. 1 


SA-996. 1 


SA-997.2 


SA-998.2 


! SA-999.1 


2323 


2324 


2325 


2326 


2327 | 


2328 


2329 


2330 


2331 


2332 


2333 


2334 


2335 


2336 


2337 


2338 


4476 2339 


2340 


2341 


2342 


2343 


2344 


4460 


4461 


4462 


4463 


4464 


4465 


4466 | 


4467 


4468 


4469 


4470 


4471 


4472 


4473 


4474 


4475 


4477 


4478 


4479 


4480 


! 4481 


SEQ ID n° 6596 


SEQ ID n° 6597 


SEQ ID n° 6598 


CD 
CD 

to 

CO 

o 

Q 

a 

LU 

CO 


SEQ ID n° 6600 


SEQ ID n° 6601 


SEQ ID n° 6602 


SEQ ID n° 6603 


SEQ ID n° 6604 


SEQ ID n° 6605 


CD 
O 
CO 

co 

o 

Q 
O 

LU 

CO 


o 

CO 
CO 

o 

a 
Q 

a 

LU 

CO 


oo 
o 

CO 
CO 
o 

c: 
Q 

O 

LU 

CO 


|SEQ ID n° 6609 


SEQ ID n° 6610 


CO 
CO 

o 

Q 
O 

LU 

CO 


SEQ ID n° 6612 


SEQ ID n° 6613 


SEQ ID n° 6614 


SEQ ID n° 6615 


SEQ ID n° 6616 


SEQ ID n° 6617 
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TABLEAU 4 . Localisation des 139 contigs de sequence SEQ ID No. 1 a SEQ ID No. 
139 sur la sequence genomique complete (SEQ ID No. 2345). 







Position sur genome 
complet (= SEQ ID n°2345) 


Sens 


SEQ ID 


Contig 


position ueout 


position rin 


(m=minus / 
p=plus) 


SEQ ID n°1 


Contigl 


1356648 


1355991 


m 


SEQ ID n°2 


Contig2 


341651 


341120 


m 


SEQ ID n°3 


Contig3 


476798 


476418 


m 


SEQ ID n°4 


Contig4 


1475712 


1475086 


m 


SEQ ID n°5 


ContigS 


784818 


784243 


m 


SEQ ID n°6 


Contig6 


1756826 


1757251 


P 


SEQ ID n°7 


Contig7 


1950108 


1949648 


m 


SEQ ID n°8 


Contig8 


138225 


138876 


P 


SEQ ID n°9 


Contig9 


2097891 


2098283 


P 


SEQ ID n°10 


Contigl 0 


1238491 


1237984 


m 


SEQIDn°11 


Contigl 1 


1882130 


1881745 


m 


SEQIDn°12 


Contigl 2 


1089348 


1 088935 


m 


SEQ ID n°13 


Contigl 3 


555788 


555189 


m 


SEQ ID n°14 


Contigl 4 


2017928 


2017437 


m 


SEQ ID n°15 


Contigl 5 


1 1 54094 


1154701 


P 


SEQ ID n°16 


Contigl 6 


752647 


753091 


P 


SEQIDn°17 


Contigl 7 


1355561 


1355078 


m 


SEQ ID n°18 


Contigl 8 


1255951 


1256101 


P 


SEQ IDn°19 


Contigl 9 


792712 


793148 


P 


SEQ ID n°20 


Contig20 


481787 


482228 


P 


SEQ ID n°22 


Contig22 


1 590263 


1 590842 


P 


SEQ ID n°23 


Contig23 


508269 


508918 


P 


SEQ ID n°24 


Contig24 


1142198 


1142488 


P 


SEQ ID n°25 


Contig25 


1982019 


1981737 


m 


SEQ ID n°26 


Contig26 


119342 


119919 


P 


SEQ ID n°28 


Contig28 


1124069 


1123256 


m 


SEQ ID n°29 


Contig29 


266586 


266900 


P 


SEQ ID n°30 


Contig30 


111013 


111623 


P 


SEQ ID n°31 


Contig31 


1804173 


1 804706 


P 


SEQ ID n°32 


Contig32 


2170341 


2169828 


m 


SEQ ID n°33 


Contig33 


1959867 


1 959394 


m 


SEQ ID n°34 


Contig34 


1295529 


1294939 


m 


SEQ ID n°35 


Contig35 


178592 


178071 


m 


SEQ ID n°36 


Contig36 


1857103 


1856614 


m 


SEQ ID n°37 


Contig37 


1063484 


1063911 


P 


SEQ ID n°38 


Contig38 


198025 


197570 


m 


SEQ ID n°39 


Contig39 


1486076 


1486553 


P 


SEQ ID n°40 


Contig40 


2033914 


2034352 


P 


SEQ ID n°41 


Contig41 


737932 


738486 


P 


SEQ ID n°42 


Contig42 


729008 


728453 


m 


SEQ ID n°43 


Contig43 


1671733 


1672151 


P 
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Opn irk r\°AA 

otu iu n 44 


^oniig44 


a 1 n^no-1 
i i uouy i 


I I UOD44 


P 


O tU IU n 40 


A r\r\k\r*A 

^ODllg40 


f uu i oy 


oyyooo 


1 1 1 


otu lu n 40 


L*oniig4o 


9fl7^91 
ZU / OZ I 


zuooy / 


III 


CCA in n°/17 

otu fu n 4/ 


A r\r\\\r% A 7 

\^onng4 / 


I U040U0 


i uoouyy 


P 


otu iu n 4o 


uontig4o 


i uy i ooo 


i uyzzo i 


P 


CCA 1 p\ n°/IQ 

otu iu n 4y 


^oniig4y 


A 7H1 7£v<l 
I / U I / D4 


i / uuyuo 


m 
1 1 1 


cca i n n °^n 

otu iu n ou 


oonngou 


ouyu / z 


ouyoyu 


P 


cca in n°f;i 
ocu iu n o i 


A/^nfi,-! C -1 

oonugo I 


i4oyz/ \ 


I too 1 ou 


1 1 1 


CCA I A n °CO 

olw iu n oz 


ounugoz 


ououo 


OU 1 o*+ 


m 
1 1 1 


otu iu n oo 


ooniigoo 


zoyo4o 


zoyzo4 


1 1 1 


cca in 
olvJ iu n 04 


A ntin ^yl 

v^unugo4 


I OOOHOO 


I ooouoo 


1 1 1 


CCA m n°RR 

otu iu n oo 


oonugoo 


ouy4zu 


O I U40U 


P 


CCA IPI n°^R 

otu iu n oo 


v>/oniigoo 


i ooyyo4 


I OOO / Ui7 


1 1 1 


OCA in n °CO 

otu iu n oo 


oonugoo 


Z IOO/ IZ 


z looyzo 


1 1 1 


CCA m n°f%Q 

otu iu n oy 


oonugoy 


i y i youo 


i yzuyo4 


P 


CCA m n°fifl 

otu iu n ou 


ooniigou 


yozooo 


oOUhOO 


III 


CCA in r-i°£M 

otu iu n o i 


oonugo i 


i oooo4y 


I OOO / Z4 


P 


CCA in r*°ftO 

otu iu n Oil 


ooniigoz 


I I4UOUO 


\ lOf Z04 


rri 

m 


CCA in n 0 ^^ 

otu iu n oo 


v-/oniigoo 


17099/19 
I /UZZ4Z 


1 1 uouoy 


p 


CCA in n 

otu iu n 04 


\^oniigo4 


i4yuz/ I 


1 4yozoo 


p 


CCA in 

otu iu n oo 


i^onugoo 


/ OOZUO 


# ooozo 


P 


cca in n°ftft 

otu iu n oo 


i^onugoo 


OOZO I o 


O4yo i o 


m 


CCA in n°C7 

otu iu n o/ 


i^onugo / 


I OOZOUO 


l OOU I O I 


III 


CCA in n°CQ 

otU ID n Do 


uontigoo 


1 OT4UOU 


a(za nn^A 


P 


OCA in n°KQ 

otu iu n oy 


oonxigoy 


1 404000 


A AQfiClAI 
\ 4yuU4Z 


P 


cca in n°7n 

otu iu n /U 


oontig / u 


o i U4yo 


ElA&A AO 
O ID44y 


P 


CCA in n°7A 

otu iu n f\ 


Artnti/-i71 

L/Oniig/ I 


I zouoz 


IZ I Z I o 


111 


CCA in n°70 

otu id n / z 


oontig/ z 


I OO / 044 


i oo 1 oyz 


III 


CCA in n°~7Q 

otu iu n / o 


L/Orliig / o 


140 / U f 


i4ozoy 


111 


QCA m rt°7A 

otu iu n / 4 


L/Omig / 4 


ooy i uo 


00Z400 


m 
III 


cca in n°7c; 

otu iu n /o 


A r» ti « "7 K 

i^onug/ o 


i z i yooo 


A OA R^AO 
\ Z 1 004Z 


111 


CCA in n°7ft 

otu iu n fu 


L/Onxig/ o 


i uy i oz / 


1 UOO / Z4 


111 


CCA in n°77 

otu iu n / / 




i z4oy / o 


A ORA OfkA 

\ zo i yo4 


P 


CCA in n°7Q 

otu iu n fo 


oontig / o 


I I ozou 


IZ IOOO 


ITS 
P 


CCA in n°7Q 

otu iu n a y 


L/Oniig / y 


l lUUOUU 


A CiQOClOA 

\ uyzoz4 


Ml 


cca in n°Qn 

otu iu n ou 


oonugou 


A A CYJCkA Q 

i 1 u/ y4o 


A A nfiR9R 

l 1 uuozo 


m 


CCA in n°Q1 

otU IU n ol 


A/-\i-«*i/-» Q i 

LfOntigoi 


1 Z404OO 


I ZO / 40 I 


m 


CCA in n°QO 

otu iu n oz 


ooniigoz 


OA A A 90£5 

zi n zyo 


Z IU4UOO 


m 


CCA in n°QQ 

otU IU n oo 


L/Onilyoo 


oo4/ y 


97i "*9 
Z f I OZ 


111 


CCA in n°QA 

otu IU n 04 


L/Oniigo4 


1 *JOQC1 yl 

i ooyo 1 4 


I oouozo 


P 


cca in n°o(; 

otu iu n oo 


uoniigoo 


9H7n/l9'5 
ZU / U4ZO 


ZuOO 140 


m 


cca in n°ftfi 

OCw IU II ou 


bui my ou 




14700^^5 

1 *T 1 UU 


p 


SEQ ID n°87 


Contig87 


526582 


517432 


m 


SEQ ID n°88 


Contig88 


1484487 


1470171 


m 


SEQ ID n°89 


Contig89 


1124087 


1 1 36746 


P 


SEQ ID n°90 


Contig90 


1879890 


1866931 


m 


SEQ ID n°91 


Contig91 


1721684 


1706045 


m 


SEQ ID n°92 


Contig92 


1358184 


1357897 


m 


SEQ ID n°93 


Contig93 


1577596 


1560798 


m 


SEQ ID n°94 


Contig94 


115130 


103188 


m 
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OCA in n°QR 

otu iu n yo 


L/Oniigyo 


1 OOAHRA 

i yzi uo i 


i yoooo I 


P 


CCO 1 R n°Qft 

otu iu n yo 


oonugyo 


i y^^yuo 


i yoo / OZ 


m 


crn ir> n oQ7 

otu iu n y/ 


L/Ontigy / 


i y i yoz4 


i yuoyoo 


111 


otu iu n yo 


L/Oniigyo 


zuyuooy 


Z IUOOOO 


P 


CCA IP\ n °00 

otu iu n yy 


L/Oniigyy 


-I 007/lftO 
I ZO / 4oZ 


i OA Q/IOQ 

iz i y^zo 


m 


otu iu n iuu 


oontiy 1 uu 


1 IZO 1 1 u 


i I uo i y i 


m 


otU IU n T U I 


r\r\k\r%A C\A 

oonug i u i 


I OO I ooo 


i ozy*f oo 


III 


q in n° a no 
otu iu n i uz 


Anntin i OO 

ooniig i uz 


I O I OO I I 


i ouuy / o 


rin 
111 


otu iu n i uo 


o*^r»ti«i no. 
L^oniig 1 uo 


7fiil7fi1 
/ O** / O I 


700 -I QC 

/ oo i yo 


P 


ceo ir r-»° -i c\a 

otu iu n i U4 


0/-\nf A O/l 

L/Oniig IU4 


I uooouo 


i uooyoo 


111 


ceo in n 0- i 
otu iu n i uo 


0/>ntin "1 

oonug i uo 


I zo^+zo 


AAV\Ar\o 
I *+o I uz 


P 


ceo in n° i c\& 
otu iu n iuo 


oomig i uo 


yoz*ioo 


yo4oo/ 


n 
P 


ceo ir ^l o ^^"7 
otu iu n i u/ 


n\nt\r\ A C\~7 

L/Onug 1 U# 


i loyooo 


i i yu i yo 


P 


ceo ir n°in$5 
otu iu n i uo 


oomig i uo 


zuyu*tzo 


on7nRR7 

zu f UOO f 


III 


ceo in n°i no 
otu iu n iuy 


coring i uy 


I l*fUO \ o 


I loy^toz 


P 


ceo ir n 0/ i i a 
otu iu n in 


ooniig i i i 


zoozy i 


ZOOf I o 


P 


ceo ir n 0/ t -io 
otu iu n i iz 


L/Onug i iz 


Z IOOOO 


ZO / OO I 


P 


CeO IR n°i*1Q 

otu iu n no 


oonugi i o 


zzuyoz i 


loyo/ 


III 


CeO IR r\°AAA 

otu iu n i \h 


Om-it in AAA 

oonugi 14 


I OOOOO f 


i yuoy i o 


P 


ceo ir n° i i c: 

otu iu n no 


ooniigi io 


Ih-O / / z 


I f zuuy 


P 


CeO IR r\° A AG. 

otu iu n i lo 


Onr-ifln-l -1 ft 

oonng i io 


OUO I O I 




111 


CCO IR r\°AA~7 

otu iu n ill 


A/M^f in *l i 7 

OOniigi 1 / 


ooyzoo 


oooZ / O 


P 


CCO IR n°11fi 

otu iu n iio 


/^nnf ini A Q 

^oniig 1 1 o 


i ozyu^+o 


i*+y4z i o 


m 


cco ir\ *\°aaci 

otu iu n i iy 


oontigi iy 


4/01 oZ 


y| QQQ71 
4000 / I 


m 


ceo ir n° a on 
otu IU n IZU 


ooniig i zu 


1 Qft1 ft^7 

i yo i oo / 


I y*tOODD 


111 


CCO IR n°AOA 

otu IU n izi 


ijronug i z l 


ACZA ^ftOil 
I O I OOZ*l 


A ^77^Q4 


111 


CCO IR n°'IOO 

otu iu n izz 


Onnfin i OO 

L/Onug i zz 


A 7ftRP/lA 
I /00040 


1 OUUO 1 f 


P 


CCO IR r-»° -1 OO 

otu iu n izo 


Onrnfini OO 

oontigizo 


OA A A AQO 

z i i i*i-yy 


OA 

Z I OOOO I 


P 


CCO IR n° -1 O/l 

otu iu n 


ooniig i z*\ 


I /Z I ooo 


i / OO/ OO 


P 


CCO IR n°iO£ 

otu iu n izo 


r\r\k\r% A OR 

isOnug i zo 


yo^-^fuo 


1 no^i 7ft 

I UZO I / o 


P 


CCO IR r\° A OC 

otu iu n izo 


uontig izo 


i zyo^oo 


i ooyooo 


P 


CCO IR n°107 

otu iu n iz/ 


Pnnfin -1 07 

oontigiz/ 


z looyn 


A 7RQ'10 
I / OOOZ 


m 


CCO IR n° -1 OQ 

otu iu n izo 


Om-if In 10Q 

oontigi zo 


i on oy^f i 


\ OOOOO I 


P 


cco ir f-\° -i on 

otu iu n izy 


/"» n rt f in ^ OO 

uontig i zy 


o4yooo 


/ oo/ yo 


m 


CCO IR f-»° d q n 

otu iu n iou 


oontigi ou 


QQQOQO 

ooozyz 


youz / u 


n 
P 


CeO IR n° i 01 

otu iu n i o i 


Onntinl Oi 

v^/Ui iug I O I 


ZZUOODO 


OACCOA C 

Z I UOZ I o 


1 1 1 


SEQ ID n°132 


Contig132 


33590 


88257 


P 


SEQ ID n°133 


Contig133 


1982609 


2057812 


P 


SEQIDn°134 


Contig134 


1 700642 


1618142 


m 


SEQ ID n°135 


Contig135 


1293063 


1190375 


m 


SEQ ID n°136 


Contig136 


1 366980 


1462324 


P 


SEQ ID n°137 


Contig137 


390853 


434186 


P 


SEQ ID n°138 


Contig138 


357393 


259739 


m 


SEQ ID n°139 


Contig139 


527049 


716899 


P 
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TABLEAU 5 . Propriete d'adherence a des cellules epitheliales humaines en culture de la 
souche NEM3 1 6 de S. agalactiae et de souches mutantes derivees. 



Souche 


Gene inactive 


% d'adhesion 3 






Cellules A549 


Cellules Hela 


NEM316 


aucun 


9 


16 


NEM1979 


IPFN° 1268 (srtA) 


1,5 


2 


NEM2056 


IPF N° 678 


2 


n.t. 


NEM2057 


IPF N° 1 503 


4,5 


n.t. 



5 a , le pourcentage d'adhesion correspond au nombre de bacteries (Unite Formant des 
Colonies, UFC) restant adherentes aux cellules apres lavage avec du tampon PBS par 
rapport au nombre d'UFC ajoutees a la monocouche de cellules epitheliales. 
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Amidase 


AmylopuUulanase alkaline 


inconnue 
inconnue 


inconnue 
inconnue 


inconnue 


Surface exclusion protein 


inconnue 


Surface exclusion protein 


inconnue 


inconnue 


inconnue 


Proteine liant la fibronectine 


inconnue 
inconnue 


inconnue 


inconnue 


36 (54) / 478 
35 (54) / 492 


65 (79)/ 1095 


23(47)/ 373 
26(50) / 273 


37(52) / 405 
36(52)/ 399 


33 (49)/ 225 


24 (37)/ 715 


3 1 (47) / 263 


22 (40) / 784 


33 (47)/ 211 






32(46)/ 176 


27(42)/ 512 
25(38)/ 577 






AmiC (S, pyogenes) 
YbgE (L. lactis) 


PulA (S. pyogenes) 


CGI 5040 gene product Drosophila 

melanogaster 
Antigen p200 (Babesia bigemina) 


SpaA ( S. sobrinus) 
Pas (S. intermedius) 


Plasmid-encoded protein (E. faecalis) 


Sec 10 (E. faecalis) 


Plasmid-encoded protein (E. faecalis) 


Sec 10 (E. faecalis) 


Plasmid-encoded protein (E. faecalis) 


No homology in public databases 


No homology in public databases 


PFBP (S. pyogenes) 


Hypothetical protein 2 (Lactobacillus 

leichmannii) 
Fimbrial structural subunit (Actinomyces 

naeslundii) 


No homology in public databases 


No homology in public databases 
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6246 
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6447 


5607 
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TABLEAU 7 . Distribution des genes codant pour des proteines de surface a motif 
LPXTG parmi des isolats cliniques independants de 5 serotypes de& agalactiae. 



Seq ID 

(ADN) 


N° d'IPF 


Proportion des souches portant le gene 


J. J jJ*-' 1C4 

23 isolats 


Tvne TH 
7 isolats 


Tvne TT 
12 isolats 


Tvoe HI 
39 isolats 


Type V 

16 
isolats 


non 
groupe 
2 isolats 


Frequence 
totale 

yy isolats 


4926 


1503 


100 


100 


100 


100 


100 


100 


100 


6331 


678 


100 


100 


100 


100 


100 


100 


100 


5491 


2192 


100 


100 


100 


100 


100 


100 


100 


5234 


1861 


100 


100 


100 


100 


100 


100 


100 


6246 


584 


100 


100 


100 


100 


100 


100 


100 


5842 


280 


100 


100 


100 


100 


100 


100 


100 


6247 


585 


86,9 


85,7 


91,7 


92,3 


81,3 


100 


88,9 


4965 


1551 


34,8 


85,7 


100 


94,8 


93,8 


100 


80,8 


6447 


807 


26,1 


85,7 


83,3 


92,3 


93,8 


100 


79,8 


5610 


2337 


86,9 


100 


100 


56,4 


100 


50 


78,8 


6236 


571 


82,6 


100 


83,3 


46,1 


100 


50 


71,7 


5103 


1716 


91,0 


100 


83,3 


38,5 


81,3 


50 


67,7 


5607 


2334 


56,5 


100 


83,3 


46,1 


100 


50 


65,6 


6411 


765 


30,4 


71,4 


41,7 


61,5 


87,5 


100 


57,6 


4921 


15 


65,2 


0 


41,7 


59 


12,5 


50 


46,5 


5090 


17 


4,3 


14,3 


16,7 


20,5 


6,3 


0 


13,1 


5180 


18 


4,3 


14,3 


0 


20,5 


6,3 


0 


11,1 


4706 


1248 


0 


0 


0 


12,8 


6,3 


0 


6 


5497 


220 


0 


14,3 


8,3 


5,1 


0 


0 


4,5 


4708 


1250 


0 


14,3 


0 


5,1 


0 


0 


3 


5677 


2414 


0 | 0 


0 


7,7 


0 


0 


3 
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TABLEAU 8 . Lipoproteins 



Seq ID 

(ADN) 


N° 
d'IPF 


/vnnoraiion 


6527 


9 


unknown 


6030 


339 


similar to unknown proteins 

x 


6035 


344 


Similar to ABC transporter (binding protein) 


6137 


460 


Similar to ABC transporter (binding protein) 


6178 


504 


similar to unknown proteins 


6294 


638 


Similar to unknown proteins 


6335 


682 


Similar to adhesion proteins 

X 


6377 


729 


similar to oligopeptide and pheromone binding protein 


6386 


739 


similar to other lipoprotein 


4495 


1018 


Similar to (oligopeptide) ABC transporter (binding protein) 

X <J XX S X N. W*r X X 


4596 


1119 


similar to ribose ABC transporter (binding protein) 

X V X x 


4636 


1162 


similar to (amino acid ?) ABC transporter (binding protein) 

V S XV +mS X X 


4730 


1280 


similar to ABC transporter (binding protein) 


4816 


1377 


Similar to nickel ABC transporter (binding protein) 

X V x s 


4836 


1399 


similar to phosphate ABC transporter (binding protein) 

X X X V MmJ x s 


4906 


1481 


Similar to D,D-carboxypeptidase 


4920 


1499 


similar to peptidyl -prolyl cis-trans isomerase 


4925 


1502 


similar to metal ABC transporter (binding protein) 


4963 


1547 


Unknown 


5021 


1617 


Similar to unknown lipoprotein 


5158 


1775 


similar to ferrichrome ABC transporter (binding protein) 


5247 


1879 


similar to oligopeptide ABC transporter (binding protein) 


5306 


1955 


similar to glycine betaine/carnitine/choline ABC transporter (osmoprotectant- 
binding protein) 


5417 


2099 


similar to putative ABC transporter (binding protein) 


5423 


2103 


Unknwon, similar to unknown protein and to B. subtilis SpoIIIJ protein 


5450 


2133 


laminin-binding surface protein 


5486 


2185 


putative ABC transporter (binding protein) 
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5559 


2278 


putative ABC transporter (binding protein) 


5591 


2314 


similar to protease maturation protein 


5677 


2414 


Similar to plasmid related proteins, Putative peptidoglycan bound protein 
(LPXTG motif) 


5718 


2464 


Similar to unknown proteins 


5732 


2482 


similar to ferrichrome ABC transporter (binding protein) 


5799 


2597 


similar to amino acid ABC transporter (binding protein) 


5800 


2598 


similar to phosphate ABC transporter (binding protein) 


5837 


2789 


Unknown 


5861 


2843 


Similar to amino acid ABC transporter (binding protein) 


5883 


2875 


Unknown 


5923 


2922 


Similar to amino acid ABC transporter (binding protein) 



Les genes codant pour des lipoproteines ont ete identifies sur la base de la 
prediction du motif de coupure / modification de type lipoproteine [S. Hayashi, H. C. 
Wu. J Bioenerg Biomembr. 22, 451 (1990)] et d'un peptide signal (identifie en utilisant 
5 SignalP vs2.0 [H Nielsen, Prot Engin 12, 13-9. (1999)]) et par l'analyse des resultats de 
comparaison sur les banques de sequence proteiques en utilisant BLAST [S. F. Altschul 
et al., Nucleic Acids Res 25, 3389-402. (1997)]. 

Tableau 9 . Autres proteines de surface 



10 



Seq ID 

(ADN) 


N° d'IPF 


Annotation 


6037 


347 


group B streptococcal surface immunogenic protein 


4972 


1562 


Putative cell wall protein, weakly similar to peptidase or esterase 


6569 


948 


similar to fibronectin-binding protein 


5234 


1861 


similar to cell wall proteins 


5530 


2238 


possible surface protein 


5223 


1847 


CAMP factor 



WO 02/092818 



422 



PCT/IB02/03059 



Ces proteines ont ete identifiees sur la base de similarity avec d'autres proteines 
de surface bacterienne et la prediction d'un peptide signal et ne faisant pas partie des 
classes des proteines ancrees au peptidoglycane et lipoproteines. 



5 TABLEAU 10 . Proteines impliquees dans la biosynthese de composes 
polysaccharidiques de la paroi de S. agalactiae. 



Seq ID 


N° d'IPF 


Annotation 


Commentaires 


4861 


1430 


similar to Streptococcus mutans RgpG protein required for 
biosynthesis of rhamnose-glucose polysaccharide 




6214 


544 


similar to rhamnosyltransferase 




6061 


381 


Unnown, Similar to UDP-N-acetylmuramoylalanine— D- 
glutamate ligase 




6517 


890 


similar to Cell Wall Muropeptide Branching Enzyme 




6518 


891 


similar to cell wall muropeptide branching enzyme 




6519 


892 


similar to cell wall muropeptide branching enzyme 




4743 


1295 


similar to glycosyltransferases 




6343 


692 


similar to hexosyltransferase 




6342 


691 


similar to glucosyl transferase 




5326 


1977 


Similar to UDP~D-glucose:galactosyl glucosyltransferase 




4952 


1532 


similar to N-acetylneuraminic acid synthetase 


Biosynthese de 
la capsule 


5619 


2346 


capsular polysaccharide biosynthesis protein 


5618 


2345 


similar to glycosyl transferase 


5617 


2344 


similar to glycosyl transferase 


5616 


2343 


capsular polysaccharide repeating-unit polymerase 


5615 


2342 


beta-1 ,4-galactosyltransferase 


5614 


2341 


beta-1 ,4-galactosyltransferase enhancer 


5613 


2340 


similar to glucose- 1 -phosphate transferase 


5611 


2339 


capsular polysaccharide chain length regulator/exporter 


5696 


2437 


putative chain length regulator CpsC 




5971 


301 


similar to dTDP-glucose-4 ? 6-dehydratase 




5233 


1860 


similar to to Cell Wall Muropeptide Branching Enzyme 
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5602 


2329 


similar to capsular oolyglutamate biosynthesis 




5156 


1773 


Similar to UDP-N-acetvlmuramoylalanyl-D-glutamyl-2, 6- 
diaminopimelate ligase 




5574 


2297 


Similar to putative hexosyltransferase 




5573 


2296 


Similar to rhamnosyl transferase I 




5654 


2386 


Similar to capsular polysaccharide synthesis protein 




5656 


2388 


Similar to putative rhamnosyl transferase 




5526 


2233 


Similar to putative rhamnosyltransferase 




5527 


2235 


Similar to nucleotide-sugar dehydratase 




5529 


2237 


Similar to Pneumococcal LicD2 protein involved in 
phosphorylcholine metabolism 

1^ IT J 




5534 


2241 


similar to rhamnosyltransferase 




5625 


2354 


similar to putative rhamnosyltransferase 




5626 


2355 


dTDP-L-rhamnose synthase 




6223 


555 


Similar to putative glucosyl transferase 




6229 


562 


Similar to hypothetical glycosyl transferase 




6230 


563 


Similar to putative glycosyltransferase 




6231 


565 


Similar to putative glycosyl transferase 




6232 


566 


Similar to putative glycosyl transferase 




6233 


567 


Similar to putative glycosyl transferase 




5764 


2518 


similar to putative sugar transferase 




6095 


416 


similar to UDP-N-acetylglucosamine pyrophosphorylase 




5089 


1699 


Similar to UDP-N-acetylmuramate-alanine ligase 




5466 


2158 


similar to glycosyl transferase 




5465 


2157 


similar to glycosyl transferase 





Ces genes ont ete identifies par Tanalyse des resultats de similarite avec les 
sequences proteiques connues en utilisant le logiciel BLASTP. Les produits de ces 
genes pourraient intervenir dans la biosynthese de polysaccharides qui pourraient etre 
5 des constituants de preparations vaccinales. 
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REVENDICATIONS 



1. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 
ce qu'elle est choisie parmi les sequences SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID 

5 No. 2345. 

2. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 
ce qu'elle est choisie parmi : 

a) une sequence nucleotidique comportant au moins 75 % d'identite avec une sequence 
choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345 ; 
10 b) une sequence nucleotidique hybridant dans des conditions de forte stringence avec 
une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et 
comprenant au moins 20 nucleotides ; 

c) une sequence nucleotidique complementaire d'une sequence choisie parmi SEQ ID 
No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou complementaire d'une sequence 

1 5 nucleotidique telle que definie en a), ou b), ou une sequence nucleotidique de TARN 

correspondant a Tune des sequences a) ou b) ; 

d) une sequence nucleotidique d'un fragment representatif d'une sequence choisie 
parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou d'un fragment 
representatif d'une sequence nucleotidique telle que definie en a), b) ou c) et 

20 comprenant au moins 20 nucleotides ; 

e) une sequence nucleotidique comprenant une sequence telle que definie en a), b), c) 
ou d) ; et 

f) une sequence nucleotidique telle que definie en a), b), c), d) ou e) modifiee et 
comportant au plus 10 % de nucleotides modifies par rapport a la sequence de 

25 reference. 

3. Sequence nucleotidique selon la revendication 2, caracterisee en ce qu'il 
s'agit d'une sequence issue d'une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 
139 et SEQ ID No. 2345, et en ce qu'elle code pour un polypeptide, choisi de 
preference parmi les sequences SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 

30 2346 a SEQ ID No. 448 1 . 

4. Sequence nucleotidique caracterisee en ce qu'elle comprend une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique selon la revendication 3 ou choisie parmi les sequences 
SEQ ID No. 4482 a SEQ ID No. 6617 ; 



WO 02/092818 



426 



PCT/IB02/03059 



b) une sequence nucleotidique comportant au moins 75 % d'identite avec une sequence 
nucleotidique selon la revendication 3 ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique selon la revendication 3 et comprenant au moins 20 

5 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 

10 f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant au plus 
1 0 % de nucleotides modifies par rapport a la sequence de reference. 

5. Polypeptide code par une sequence nucleotidique selon Tune des 
revendications 2 a 4. 

6. Polypeptide selon la revendication 5, caracterise en ce qu'il est choisi parmi 
15 les polypeptides choisis parmi SEQ ID No. 140 a SEQ ID No. 2344, et SEQ ID No. 

2346 a SEQ ID No. 4481. 

7. Polypeptide caracterise en ce qu'il comprend un polypeptide choisi parmi : 

a) un polypeptide selon Tune des revendications 5 et 6 ; 

b) un polypeptide presentant au moins 80 % d'identite avec un polypeptide selon Tune 
20 des revendications 5 et 6 ; 

c) un fragment d'au moins 5 acides amines d'un polypeptide selon Tune des 
revendications 5 et 6, ou tel que defini en b) ; 

d) un fragment biologiquement actif d'un polypeptide selon l'une des revendications 5 
et 6, ou tel que defini en b) ou c) ; et 

25 e) un polypeptide selon l'une des revendications 5 et 6 ou tel que defini en b), c) ou d) 
modifie et comportant au plus 10 % d'acides amines modifies par rapport a la 
sequence de reference. 

8. Sequence nucleotidique codant pour un polypeptide selon la revendication 

7. 

30 9. Sequence nucleotidique isolee codant pour un polypeptide specifique de 

Streptococcus agalactiae choisi parmi les polypeptides de sequence SEQ ID No. 140 a 
SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 . 
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10. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans la biosynthese des acides amines ou Tun de ses fragments. 

11. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
5 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans la biosynthese des cofacteurs, groupes prosthetiques et transporters ou 
Tun de ses fragments. 

12. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide d'enveloppe cellulaire ou situe a la 

1 0 surface de Streptococcus agalactiae ou Tun de ses fragments. 

13. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans la machinerie cellulaire ou 1'un de ses fragments. 

14. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
15 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le metabolisme intermediaire central ou l'un de ses fragments. 

15. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le metabolisme energenique ou l'un de ses fragments. 

20 16. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 

caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le metabolisme des acides gras et des phospholipides ou l'un de ses 
fragments. 

17. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
25 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le metabolisme des nucleotides, des purines, des pyrimidines ou 
nucleosides ou l'un de ses fragments. 

18. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

30 implique dans les fonctions de regulation ou l'un de ses fragments. 

19. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de replication ou l'un de ses* fragments. 
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20. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de transcription ou Tun de ses fragments. 

21. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
5 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le processus de traduction ou Tun de ses fragments. 

22. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de transport et de liaison des proteines ou l'un de ses 

1 0 fragments. 

23. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans Padaptation aux conditions atypiques ou l'un de ses fragments. 

24. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
15 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans la sensibilite aux medicaments et analogues ou l'un de ses fragments. 

25. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans les fonctions relatives aux transposons ou l'un de ses fragments. 

20 26. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 

ce qu'elle est choisie parmi : 

a) une sequence choisie parmi les sequences SEQ ID N° 
6194,6236,5497,5791,5103,4705,5610,5234,4926,6331,6247^^ 

0,4706,4708,5677,6246,6411,5578,6446,6447,5607,6209,6215,5406,5658,4965, de 
25 preference parmi les sequences SEQ ID N°4926,633 1,5491,5234,6246,5842 ; 

b) une sequence nucleotidique comportant au moins 75 % d'identite avec une 
sequence nucleotidique du a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique du a) ou b) et comprenant au moins 20 

30 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle 
que definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 
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f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant 
au plus 10 % de nucleotides modifies par rapport a la sequence de reference ; 

et en ce qu'elle code pour une proteine de surface avec un motif d'ancrage 
LPXTG. 

5 27. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 

ce qu'elle est choisie parmi les sequences SEQ ID 
N°6035,6137,6335,6377,6386,4495,4596,4636,4730,48^ 

247, 5306,5417,5450,5486,5559,5591,5677,5732,5799,5800,5861,5923 et en ce qu'elle 
code pour une lipoproteine. 

10 28. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 

ce qu'elle est choisie parmi les sequences SEQ ID 
N°486 1 ,62 1 4,606 1 ,65 1 7,65 1 8,65 1 9^ 

615,5614,5613,5611,5696,5971,5233,5602,5156,5574,5573,5654,5656,5526,5527,5529 

,5534,5625,5626,6223,6229,6230,6231,6232,6233,5764,6095,5089,5466,5465 et en ce 
15 qu'elle code pour une proteine impliquee dans la biosynthese de composes 

polysaccharidiques de paroi. 

29. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la biosynthese des 

acides amines ou Fun de ses fragments. 
20 30. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la biosynthese des 

cofacteurs, groupes prosthetiques et transporters ou l'un de ses fragments. 

31. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide d'enveloppe cellulaire ou situ6 a la surface de Streptococcus 

25 agalactiae ou l'un de ses fragments. 

32. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans la machinerie 
cellulaire ou l'un de ses fragments. 

33. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
30 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme 

intermediaire central ou l'un de ses fragments. 

34. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme 
energetique ou l'un de ses fragments. 
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35. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme des 
acides gras et des phospholipides ou Pun de ses fragments. 

36. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
5 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme des 

nucleotides, des purines, des pyrimidines ou nucleosides ou Pun de ses fragments. 

37. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans les fonctions de 
regulation ou Pun de ses fragments. 

10 38. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 
replication ou Pun de ses fragments. 

39. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 

1 5 transcription ou Pun de ses fragments. 

40. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 
traduction ou Pun de ses fragments. 

41. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
20 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 

transport et de liaison des proteines ou Pun de ses fragments. 

42. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans Padaptation aux 
conditions atypiques ou Pun de ses fragments. 

25 43. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la sensibilite aux 
medicaments et analogues ou Pun de ses fragments. 

44. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans les fonctions 

30 relatives aux transposons ou Pun de ses fragments. 

45. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 26 et est une proteine de surface avec un 
motif d'ancrage LPXTG. 
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46. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 27 et est une lipoproteine. 

47. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 28 et est une proteine impliquee dans la 

5 biosynthese de composes polysaccharidiques de paroi. 

48. Sequence nucleotidique utilisable comme amorce ou comme sonde, 
caracterisee en ce que ladite sequence est choisie parmi les sequences nucleotidiques 
selon l'une des revendications 2 a 4, 8 a 28. 

49. Sequence nucleotidique selon la revendication 48, caracterisee en ce qu'elle 
1 0 est marquee par un compose radioactif ou par un compose non radioactif. 

50. Sequence nucleotidique selon Tune des revendications 48 et 49, caracterisee 
en ce qu'elle est immobilisee sur un support, de maniere covalente ou non-covalente. 

51. Sequence nucleotidique selon la revendication 50, caracterisee en ce qu'elle 
est immobilisee sur un support tel qu'un filtre a haute densite ou une puce a ADN. 

15 52. Sequence nucleotidique selon Tune des revendications 49 a 51 pour la 

detection et/ou P amplification de sequences nucleiques. 

53. Puce a ADN ou filtre, caracterisee en ce qu'elle contient au moins une 
sequence nucleotidique selon la revendication 5 1 . 

54. Puce a ADN ou filtre selon la revendication 53, caracterisee en ce qu'elle 
20 contient en outre au moins une sequence nucleotidique d'un micro-organisme autre que 

Streptococcus agalactiae, immobilisee sur le support de ladite puce. 

55. Puce a ADN ou filtre selon la revendication 54, caracterisee en ce que le 
micro-organisme autre est choisi parmi un micro-organisme associe a Streptococcus 
agalactiae, une bacterie du genre Streptococcus, et un variant de Streptococcus 

25 agalactiae. 

56. Kit ou necessaire pour la detection et/ou 1' identification de bacteries 
appartenant a l'espdce Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend une puce k ADN ou un filtre selon la revendication 53. 

57. Kit ou necessaire pour la detection et/ou 1' identification d'un micro- 
30 organisme, caracterise en ce qu'il comprend une puce a ADN ou un filtre selon Tune des 

revendications 54 et 55. 

58. Kit ou necessaire pour la detection et/ou la quantification de l'expression 

- > 

d'au moins un gene de Streptococcus agalactiae, caracterise en ce qu'il comprend une 
puce a ADN ou un filtre selon Tune des revendications 53 a 55. 
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59. Vecteur de clonage, et/ou d' expression, caracterise en ce qu'il contient une 
sequence nucleotidique selon Tune des revendications 1 a 4, 8 a 28. 

60. Cellule hote, caracterisee en ce qu'elle est transformee par un vecteur selon 
la revendication 59. 

5 61. Cellule hote selon la revendication 60, caracterisee en ce qu'il s'agit d'une 

bacterie appartenant au genre Streptococcus. 

62. Cellule hote selon la revendication 61, caracterisee en ce qu'il s'agit d'une 
bacterie appartenant a l'espece Streptococcus agalactiae. 

63. Vegetal ou animal, excepte 1' Homme, comprenant une cellule transformee 
1 0 selon Tune des revendications 60 a 62. 

64. Procede de preparation d'un polypeptide, caracterise en ce que Ton cultive 
une cellule transformee par un vecteur selon la revendication 59 dans des conditions 
permettant 1'expression dudit polypeptide et que Ton recupere ledit polypeptide 
recombinant. 

15 65. Polypeptide recombinant susceptible d'etre obtenu par un procede selon la 

revendication 64. 

66. Procede de preparation d'un polypeptide synthetique selon 1'une des 
revendications 5 a 7, 29 a 47, caracterise en ce que Ton effectue une synthese chimique 
dudit polypeptide. 

20 67. Polypeptide hybride, caracterise en ce qu'il comprend au moins la sequence 

d'un polypeptide selon l'une des revendications 5 a 7, 29 a 47 et 65, et une sequence 
d'un polypeptide susceptible d'induire une reponse immunitaire chez l'homme ou 
P animal. 

68. Sequence nucleotidique codant pour un polypeptide hybride selon la 
25 revendication 67. 

69. Vecteur caracterise en ce qu'il contient une sequence nucleotidique selon la 
revendication 68. 

70. Anticorps monoclonal ou polyclonal, ses fragments, ou anticorps 
chimerique, caracterise en ce qu'il est capable de reconnaitre specifiquement un 

30 polypeptide selon l'une des revendications 5 a 7, 29 a 47, 65 et 67. 

71. Anticorps selon la revendication 70, caracterise en ce qu'il s'agit d'un 
anticorps marque. 
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72 Procede pour la detection et/ou 1' identification de bacteries appartenant a 
l'espece Streptococcus agalactiae ou a un micro-organisme associe dans un echantillon 
biologique, caracterise en ce qu'il comprend les etapes suivantes : 

a) mise en contact de 1'echantillon biologique avec un anticorps selon Tune des 
5 revendications 70 et 7 1 ; 

b) mise en evidence du complexe antigene-anticorps eventuellement forme. 

73. Procede pour la detection de l'expression d'un gene de Streptococcus 
agalactiae caracterise en ce que Ton met en contact une souche de Streptococcus 
agalactiae , avec un anticorps selon la revendication 70 ou 71 et que Ton detecte le 

1 0 complexe antigene/anticorps eventuellement forme. 

74. Kit ou necessaire pour la mise en oeuvre d'un procede selon la revendication 
72 ou 73, caracterise en ce qu'il comprend les elements suivants : 

a) un anticorps selon Tune des revendications 70 et 71 ; 

b) eventuellement, les reactifs pour la constitution du milieu propice a la reaction 
1 5 immunologique ; 

c) eventuellement, les reactifs permettant la mise en evidence des complexes antigene- 
anticorps produits par la reaction immunologique. 

75. Polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67, ou 
anticorps selon Tune des revendications 64 et 65, caracterise en ce qu'il est immobilise 

20 sur un support, notamment une puce a proteine. 

76. Puce a proteine, caracterisee en ce qu'elle contient au moins un polypeptide 
selon Tune des revendications 5 a 7, 32 a 47, 65 et 67, ou au moins un anticorps selon 
Tune des revendications 70 et 71, immobilise sur le support de ladite puce. 

77. Puce a proline selon la revendication 76, caracterisee en ce qu'elle contient 
25 en outre au moins un polypeptide de micro-organisme autre que Streptococcus 

agalactiae ou au moins un anticorps dirige contre un compose de micro-organisme autre 
que Streptococcus agalactiae, immobilise sur le support de ladite puce. 

78. Kit ou necessaire pour la detection et/ou T identification de bacteries 
appartenant a l'espece Streptococcus agalactiae ou a un micro-organisme associe, 

30 caracterise en ce qu'il comprend une puce a proteine selon l'une des revendications 76 
et 77. 

79. Kit ou necessaire pour la detection et/ou 1' identification d'un micro- 
organisme, caracterise en ce qu'il comprend une puce k proteine selon la revendication 
77. 
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80. Procede de detection et/ou d' identification de bacteries appartenant a 
l'espece Streptococcus agalactiae ouaun micro-organisme associe dans un echantillon 
biologique, caracterise en ce qu'il met en oeuvre une sequence nucleotidique selon Tune 
des revendications 2 a 4, 8, 9, 1 1 a 13, 17 a 25, 48 a 52 et 68. 
5 81. Procede selon la revendication 80, caracterise en ce qu'il comporte les 

etapes suivantes : 

a) eventuellement, isolement de l'ADN a partir de l'echantillon biologique a analyser, 
ou obtention d'un ADNc a partir de TARN de l'echantillon biologique ; 

b) amplification specifique de 1'ADN de bacteries appartenant a l'espece Streptococcus 
10 agalactiae ouaun micro-organisme associe a l'aide d'au moins une amorce selon 

Tune des revendications 48 a 52 ; 

c) mise en evidence des produits d f amplification. 

82. Procede selon la revendication 80, caracterise en ce qu'il comprend les 
etapes suivantes : 

15 a) mise en contact d'une sonde nucleotidique selon Tune des revendications 48 a 52, 
avec un echantillon biologique, l'acide nucleique contenu dans l'echantillon 
biologique ayant, le cas echeant, prealablement ete rendu accessible a l'hybridation, 
dans des conditions permettant l'hybridation de la sonde a l'acide nucleique d'une 
bacterie appartenant a l'espece Streptococcus agalactiae ou aim micro-organisme 

20 associe ; 

b) mise en evidence de l'hybride eventuellement forme entre la sonde nucleotidique et 
l'acide nucleique de l'echantillon biologique. 

83. Procede selon la revendication 80, caracterise en ce qu'il comprend les 
etapes suivantes : 

25 a) mise en contact d'une sonde nucleotidique immobilisee sur un support selon la 
revendication 50 avec un echantillon biologique, l'acide nucleique de l'echantillon 
ayant, le cas echeant, ete prealablement rendu accessible a l'hybridation, dans des 
conditions permettant l'hybridation de la sonde a l'acide nucleique d'une bacterie 
appartenant a l'espece Streptococcus agalactiae ouaun micro-organisme associe ; 

30 b) mise en contact de l'hybride forme entre la sonde nucleotidique immobilisee sur un 
support et l'acide nucleique contenu dans l'echantillon biologique, le cas echeant 
apres elimination de l'acide nucleique de l'echantillon biologique n'ayant pas 
hybride avec la sonde, avec une sonde nucleotidique marquee selon la revendication 
49; 
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c) mise en evidence du nouvel hybride forme a Petape b). 

84. Procede selon la revendication 83, caracterise en ce que, prealablement a 
Petape a), PADN de Pechantillon biologique ou PADNc obtenu eventuellement par 
transcription inverse de TARN de Pechantillon, est amplifie a Paide d'au moins une 

5 amorce selon Tune des revendications 48 a 52. 

85. Kit ou necessaire pour la detection et/ou P identification de bacteries 
appartenant a Pespece Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend les elements suivants : 

a) une sonde nucleotidique selon Tune des revendications 48 a 52; 
10 b) eventuellement, les reactifs necessaires a la mise en oeuvre d'une reaction 
d'hybridation ; 

c) eventuellement, au moins une amorce selon Pune des revendications 48 a 52 ainsi 
que les reactifs necessaires a une reaction d' amplification de PADN. 

86. Kit ou necessaire pour la detection et/ou P identification de bacteries 
15 appartenant a Pespece Streptococcus agalactiae ou a un micro-organisme associe, 

caracterise en ce qu'il comprend les elements suivants : 

a) une sonde nucleotidique, dite sonde de capture, selon la revendication 50 ; 

b) une sonde oligonucleotidique, dite sonde de revelation, selon la revendication 49; 

c) eventuellement, au moins une amorce selon Pune des revendications 48 a 52 ainsi 
20 que les reactifs necessaires a une reaction d'amplification de PADN. 

87. Kit ou necessaire pour la detection et/ou P identification de bacteries 
appartenant a Pespece Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend les elements suivants : 

a) au moins une amorce selon Pune des revendications 48 a 52; 
25 b) eventuellement, les reactifs necessaires pour effectuer une reaction d'amplification 
d'ADN; 

c) eventuellement, un composant permettant de verifier la sequence du fragment 
amplifie, plus particulierement une sonde oligonucleotidique selon Pune des 
revendications 48 a 52. 

30 88. Procede selon les revendications 72, 73 et 80 a 84 ou kit ou necessaire selon 

les revendications 74, 78, 79 et 85 a 87 pour la detection et/ou P identification de 
bacteries appartenant a Pespece Streptococcus agalactiae, caracterise en ce que ladite 
amorce et/ou ladite sonde sont choisies parmi les sequences nucleotidiques selon Pune 
des revendications 2 a 4, 8 a 28, 48 a 52, et 68 specifiques de Pespece Streptococcus 
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agalactiae, en ce que lesdits polypeptides sont choisis parmi les polypeptides selon 
1'une des revendications 5 a 7, 32 a 47, 65 et 67 specifiques de Pespece Streptococcus 
agalactiae et en ce que lesdits anticorps sont choisis parmi les anticorps selon Tune des 
revendications 70 et 71 diriges contre les polypeptides choisis parmi les polypeptides 
5 selon Tune des revendications 5 a 7, 32 a 47, 65 et 67 specifiques de Pespece 
Streptococcus agalactiae. 

89. Souche de Streptococcus agalactiae, caracterisee en ce qu'elle contient au 
moins une mutation dans au moins une sequence nucleotidique selon Tune des 
revendications 2 a 4, 8 a 28. 
10 90. Souche de Streptococcus agalactiae selon la revendication 89, caracterisee 

en ce que la mutation mene a une inactivation du gene. 

91. Souche de Streptococcus agalactiae selon la revendication 89, caracterisee 
en ce que la mutation mene a une surexpression du gene. 

92. Utilisation d'une sequence nucleotidique selon Tune des revendications 2 a 
15 4,8 a 28, d'un polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67 d'un 

anticorps selon Tune des revendications 70 et 71, d'une cellule selon Tune des 
revendications 60 a 62, et/ou d'un animal transforme selon la revendication 63 pour la 
selection de compose organique ou inorganique capable de moduler, de reguler, 
d'induire ou d'inhiber 1' expression de genes, et/ou de modifier la replication cellulaire 
20 de cellules eucaryotes ou procaryotes ou capables d'induire, d'inhiber ou d'aggraver 
chez un organisme animal ou humain les pathologies liees a une infection par 
Streptococcus agalactiae ou par un micro-organisme associe. 

93 . Methode de selection de compose capable de se lier a un polypeptide selon 
Tune des revendications 5 a 7, 32 a 47, 65 et 67, capable de se lier a une sequence 

25 nucleotidique selon Pune des revendications 2 a 4, 8 a 28, ou capable de reconnaitre un 
anticorps selon Tune des revendications 70 et 71, et/ou capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de genes, et/ou de modifier la replication cellulaire 
de cellules eucaryotes ou procaryotes, ou capable d'induire, d'inhiber ou d'aggraver 
chez un organisme animal ou humain les pathologies liees a une infection par 
30 Streptococcus agalactiae, caracterisee en ce qu'elle comprend les etapes suivantes : 

a) mise en contact dudit compose avec ledit polypeptide, ladite sequence nucleotidique, 
avec une cellule transformee selon Pune des revendications 60 a 62, et/ou 
administration dudit compose a un animal transforme selon la revendication 63 ; 
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b) determination de la capacite dudit compose a se Her avec ledit polypeptide ou ladite 
sequence nucleotidique, ou de moduler, de reguler, d'induire ou d'inhiber 
l'expression de genes, ou de moduler la croissance ou la replication cellulaire, ou 
d'induire, d'inhiber ou d'aggraver chez ledit organisme animal ou humain les 

5 pathologies liees a une infection par Streptococcus agalactiae ou par un micro- 

organisme associe. 

94. Composition pharmaceutique comprenant un compose choisi parmi les 
composes suivants : 

a) une sequence nucleotidique selon l'une des revendications 2 a 4, 8 a 28 ; 
10 b) un polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67; 

c) un vecteur selon la revendication 59 ou 69 ; et 

d) un anticorps selon la revendication 70 ou 71. 

95. Composition selon la revendication 94, eventuellement en association avec 
un vehicule pharmaceutiquement acceptable. 

1 5 96. Composition pharmaceutique selon Tune des revendications 94 et 95 pour la 

prevention et le traitement d'une infection par une bacterie appartenant a l'espece 
Streptococcus agalactiae. 

97. Composition immunogene, caracterisee en ce qu'elle comprend un ou 
plusieurs polypeptides selon Tune des revendications 5 a 7, 32 a 47, 65, et/ou un ou 

20 plusieurs polypeptides hybrides selon la revendication 67. 

98. Utilisation d'une cellule selon Tune des revendications 60 a 62, ou d'un 
vecteur selon Tune des revendications 59 ou 69 pour la preparation d'une composition 
vaccinale. 

99. Composition vaccinale, caracterisee en ce qu'elle contient un 
25 polynucleotide selon Tune des revendications 1 a 4, 8 a 28, un vecteur selon l'une des 

revendications 59 ou 69, et/ou une cellule selon Tune des revendications 60 a 62. 

100. Composition vaccinale, caracterisee en ce qu'elle contient au moins un 
polypeptide code par un polynucleotide de sequence choisie parmi SEQ ID 
N° 1 503,678,2 1 92, 1861,5 84,280. 

30 101. Composition vaccinale selon la revendication 100, caracterisee en ce qu'il 

s'agit d'une composition veterinaire 

102. Composition immunogene capable d'induire une reponse immunitaire 

•v 

cellulaire ou humorale pour la prevention ou le traitement d'une infection par une 
bacterie appartenant a l'espece Streptococcus agalactiae, caracterisee en ce qu'elle 
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comprend une composition immunogene selon la revendication 97, ou une composition 
vaccinale selon la revendication 99 ou 100, en association avec un vehicule 
pharmaceutiquement acceptable et eventuellement un ou plusieurs adjuvants de 
l'immunite appropries. 

5 103. Banque genomique de Streptococcus agalactiae CIP 82.45 (ATCC 

12403). 

104. Banque d'ADN genomique selon la revendication 101, caracterisee en ce 
que ladite banque d'ADN est clonee dans un plasmide. 

105. Banque selon la revendication 101 ou 102, caracterisee en ce qu'il s'agit 
10 de la banque deposee a la CNCM le 28 decembre 2000 sous le N° 1-2610. 

106. Utilisation des banques genomiques selon Tune des revendications 101 a 
103 pour isoler des sequences nucleotidiques specifiques de Streptococcus agalactiae, 
caracterisee en ce que les sequences nucleotidiques de Streptococcus autres que 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) sont alignees et en ce que les 

15 donnees obtenues par cet alignement sont traitees pour isoler lesdites sequences 
specifiques. 

107. Procede d ? identification de sequence specifique de Streptococcus 
agalactiae, caracterise par Talignement de sequences nucleotidiques de Streptococcus 
agalactiae selon les revendications 1 a 4, 8 a 9 et le traitement des donnees obtenues par 

20 cet alignement pour isoler les sequences specifiques. 

108. Souche mutante NEM 1979 de Streptococcus agalactiae selon la 
revendication 89 deposee a la CNCM le 24 avril 2002 sous le N° 1-2861. 

109. Souche mutante NEM 2056 de Streptococcus agalactiae selon la 
revendication 89 deposee a la CNCM le 24 avril 2002 sous le N° 1-2862. 

25 110. Souche mutante NEM 2057 de Streptococcus agalactiae selon la 

revendication 89 deposee a la CNCM le 24 avril 2002 sous le N° 1-2863. 
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document which may throw doubts on priority claim(s) or which is 
cited to establish the publication date of another citation or other 
special reason (as specified) 

document referring to an oral disclosure, use, exhibition or other 
means 

document published prior to the international filing date but later than 
the priority date claimed 



"T" later document published after the international filing date or priority 
date and not in conflict with the application but cited to understand 
the principle or theory underlying the invention 

"X" document of particular relevance; the claimed invention cannot be 
considered novel or cannot be considered to involve an inventive 
step when the document is taken alone 

"Y" document of particular relevance; the claimed invention cannot be 
considered to involve an inventive step when the document is 
combined with one or more other such documents, such combination 
being obvious to a person skilled in the art 
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Date of mailing of the international search report 
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Citation of document, with indication, where appropriate, of the relevant passages 



Relevant to claim No. 
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WO 01 14421 A (MEDIMMUNE, INC.) 
1 March 2001 (01.03.01) 



page 11, line 13 -page 26, 
Sequence listing SEQ ID NO: 



line 20 



1 9 ^ JL 2 5 
31, 

48-99, 

102, 

107-110 
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DE BOEVER, E.H. ET AL. : "TraG- related 
protein" 

Database accession no. Q9F1G0 
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The whole document 

& ERIKA H. DE BOEVER ET AL. : 
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DORAN, T. I. ET AL.: "Factors Influencing 
Release of Type III Antigens by Group B 
Streptococci " 
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page 621, hand left column , alinea 2 - 

alinea 3 
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Box I Observations where certain claims were found unsearchable (Continuation of item 1 of first sheet) 

This international searchreport has not been established inrespect of certain claims under Article 1 7 (2) (a) for the following reasons : 
1. P| Claims Nos.: 

' because they relate to subject matter not required to be searched by this Authority, namely: 



2 . | | Claims Nos . : 

because they relate to parts of the international application that do not comply with the prescribed requirements to such 
an extent that no meaningful international search can be carried out, specifically: 



3. Claims Nos.: 

1 1 because they are dependent claims and are not drafted in accordance with the second and third sentences of Rule 6 . 4(a) . 



Box II Observations where unity of invention is lacking (Continuation of item 2 of first sheet) 



This International Searching Authority found multiple inventions in this international application, as follows: 



see supplementary sheet 



1 . | | As all required additional search fees were timely paid by the applicant, this international search report covers all 

searchable claims. 

2 . [ | As all searchable claims could be searched without effort justifying an additional fee, this Authority did not invite payment 

of any additional fee. 

3 . PH As only some of the required additional search fees were timely paid by the applicant, this international search report 
covers only those claims for which fees were paid, specifically claims Nos. : 



4. I x I No required additional search fees were timely paid by the applicant. Consequently, this international search report is 
' ' restricted to the invention first mentioned in the claims; it is covered by claims Nos. : 

In particular 1-102, 107-110 



Remark on Protest | | The additional search fees were accompanied by the applicant' s protest. 

| | No protest accompanied the payment of additional search fees. 
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The International Searching Authority has determined that the present international 
application contains multiple (groups of) inventions, namely : 

1. Claims : (in part) 1-102, 107-1 10 

Nucleotide sequence of Streptococcus agalactiae, SEQ ID No. 1 , 
fragments and homologues; polypeptides coded by said sequences, 
derived polypeptides, hybrids and antibodies; probe and primer derived 
from the nucleotide sequence; use thereof for selecting compounds having 
an effect on disease states caused by an S. agalactiae infection; 
pharmaceutical compositions; DNA chips and protein; kit containing said 
chips; cloning vector, host cell, plant or animal containing said nucleotide 
sequence; use of the antibodies and of the nucleotide sequences to identify 
Streptococcus agalactiae; strain of S. agalactiae containing a mutation in 
the sequence SEQ ID No. 1; use of the nucleotide sequences to identify S. 
agalactiae-specific sequences. 

2. Claims: (in part) 1-102, 107-110 

Same as invention n° 1 , for the nucleotide sequences SEQ ID Nos. 2-1 39, 
2345 and 4482-6617 respectively. 

3. Claims: 103-106 

Gene library of Streptococcus agalactiae and use thereof. 
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DATABASE SWALL [en ligne] 

1 mars 2001 (2O01-03-01) 

DE BOEVER, E.H. ET AL. : "TraG-related 

protein" 

Database accession no. Q9F1G0 

XP002221155 

le document en entier 

& ERIKA H. DE BOEVER ET AL. : 

"Enterococcus faecal is conjugative plasmid 

pAM373: complete nucleotide sequence and 

genetic analysis of sex phromone response" 
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Cadre I Observations - lorsqu'il a ete estime que certaines revendications ne pouvaient pas faire I'objet d'une recherche 
(suite du point 1 de ia premiere feuille) 



Conformement a I'articie 17.2)a), certaines revendications n'ont pas fait I'objet d'une recherche pour ies motifs suivants: 



1. 



Les revendications n os 

se rapportent a un objet a regard duquel ('administration n'est pas tenue de procedera la recherche, a savoir: 



2. Les revendications n os > 

se rapportent a des parties de la demande internationale qui ne remplissent pas suffisamment les conditions prescrites pour 

qu'une recherche significative puisse etre effectuee, en particuiier: 



3. 



Les revendications n os .,..',.-» 

sont des revendications dependantes et ne sont pas redigees conformement aux dispositions de la deuxieme et de la 

troisieme phrases de la regie 6.4.a). 



Cadre II Observations - lorsqu'il y a absence d'unite de I'invention (suite du point 2 de la premiere feuille) 



L'administration chargee de la recherche internationale a trouve plusieurs inventions dans la demande internationale, a savoir: 



voir feuille supplemental re 



1. 



2. 



Comme toutes les taxes additionnelles ont ete payees dans les delais par le deposant, le present rapport de recherche 
internationale porte sur toutes les revendications pouvant faire I'objet d'une recherche. 

Comme toutes les recherches portant sur les revendications qui s'y prevalent cnt pu etre effectuees sans effort particuiier 
justifiant une taxe additionnelle, l'administration n'a sollicite le paiement d'aucune taxe de cette nature. 



3. 



Comme une partie seulement des taxes additionnelles demandees a ete payee dans les delais par le deposant, le present 
rapport de recherche internationale ne porte que sur les revendications pour lesquelles les taxes ont ete payees, a savoir 
les revendications n 05 



Aucune taxe additionnelle demandee n'a ete payee dans les delais par le deposant. En consequence, le present rapport 
de recherche internationale ne porte que sur I'invention mentionnee en premier lieu dans les revendications; elle est 
couverte par les revendications n os 

Partiellement 1-102, 107-110 



Remarque quant a ia reserve 



Les taxes additionnelles etaient accompagnees d'une reserve de la part du deposan 
Le paiement des taxes additionnelles n'etait assorti d'aucune reserve. 
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SUITE DES RENSEIGNEMENTS INDIQUES SUR PCT/ISA/ 210 



L' administration chargee de la recherche internationale a trouve 
plusieurs (groupes d') inventions dans la demande internationale, a 
savoir: 

1. revendi cations: Partiellement 1-102, 107-110 

Sequence nucleotidique de Streptococcus agalactiae SEQ ID 
N0:1.> fragments et homologues; polypeptides codes par ces 
sequences , polypeptides derives, hybrides et anti corps; 
sonde et amorce derives de la sequence nucleotidique; 
utilisation de ceux-ci pour la selection de composes ayant 
une influence sur les pathologies liees a une infection par 
S. agalactiae; compositions pharmaceutiques; puces a ADN et 
proteine; kit ou necessaire contenant lesdites puces; 
vecteur de clonage, cellule hote, vegetal ou animal 
contenant la sequence nucleotidique; utilisation des 
anti corps et des sequences nucleotidiques pour 
1' identification de Streptococcus agalactiae; souche de S. 
agalactiae contenant une mutation dans la sequence SEQ ID 
N0:1; utilisation des sequences nucleotidiques pour 
identifier des sequences specifiques de S. agalactiae. 

2. revendi cations: Partiellement 1-102, 107-110 

Idem au sujet 1 pour, respectivement les sequences 
nucleotidiques SEQ ID N0s:2-139, 2345, and 4482-6617 



3. revendi cations: 103-106 

Banque genomique de Straptococcus agalactiae et son 
utilisation 
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TOOLS, AND FOR IDENTIFYING THERAPEUTIC TARGETS 



00 (54) Titre : SEQUENCE DU GENOME STREPTOCOCCUS AGALACTIAE ET SES UTILISATIONS 



00 

^| (57) Abstract: The invention concerns the genome sequence and nucleotide sequences coding for Streptococcus agalactiae polypep- 
tides, such as cellular envelope polypeptides, or secreted or specific polypeptides, or polypeptides involved in the metabolism and the 
replication process, as well as vectors or cells comprising said sequences. The invention also concerns the use thereof for developing 
vaccines, diagnostic tools, DNA chips and for identifying therapeutic targets. 



(57) Abrege : L' invention a pour objet la sequence genomique et des sequences nucleotidiques codant pour des polypeptides de 
Streptococcus agalactiae, tels que des polypeptides d'enveloppe cellulaire, ou des polypeptides secretes ou specifiques, ou impliques 
dans le metabolisme et dans le processus de replication, ainsi que des vecteurs ou cellules incluant lesdites sequences. L invention 
porte egalement sur leur application au developpement de vaccins, d'outils de diagnostic, de puces a ADN et a 1' identification de 
)^ cibles therapeutiques. 
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